Biweekly[9.24-10.7]
2012-10-07
Resume
很早就打算整理一下自己的东西,做一个简历。一来是可以随时检视自己的能力(ability)和目标(objective),二来是接下来可能会有各种场合可能会用到简历的时候,有准备总是轻松得多。终于在9月底,模仿tianyi的模板,整出了自己的Web简历。发现项目经历和科研成果毫无可提之处。
陶渊明在《归园田居》中说道:“悟已往之不谏,知来者之可追!”
明了自己的缺弱,也就有了充实的方向。倒也不赖!
看了一套教授写出好简历的课程:Lynda,最大的感受就是,外国人写简历,是对自身的一次深度剖析,而不仅仅是对雇主的刻意迎合,我提供简历一来是展示自己,另一方面则是提出我的要求和兴趣,雇佣与被雇其实是双向选择。不过,只有那些有足够能力和潜力的人才能去选择,反过来就只能“被选择”了。
中秋那天晚上,劲松约了茂宋、fish还有我一起去阳光地带吃芋儿鱼鸡。Fish谈到了自己最近的面试,其中谷歌的面试最是令人惊奇:电话面试的时候就要求写online code,虽然题目不难,但是面试官完全可以看见你光标的移动和打字的水准,那可是相当扎实的考核,大家也发现,这一点对ACMer非常有利,因为ACMer经常做的就是online coding!
So——作为极力憧憬Google的童鞋,我认为还是很有必要保持一定的top coder或者Code Forces的节奏。我在简历中写到Skilled:C/C++/Python,实际上只是能用它们而已,远远谈不上“精通”,不过以此为目标,有心钻研下这两系语言是必要的!
Connect6
你问我国庆都干嘛去了?八天里,我有五天在搞六子棋,两天出去,一天颓废。
这一次主要是由于学院珠峰计划老师们催促节后要出论文,发在学院内部的专刊上。
原本是不情愿的任务,搞着搞着还搞出激情来了。我会告诉你这台thinkpad已经开了超过48小时,晚上我睡觉的时候它都在跑参数进行训练吗?嘿嘿,不过这几天和勇军一起努力,不仅把我们的软件完善得可以很好的和人对弈,并且写出了自我感觉不错,拿给同学看也觉得赞的小论文,个人感觉比《电子科大大学生学报》上的论文,还是绰绰有余了。我们把最终的软件发布后,也在本站挂一个“官方页面”,也希望大家能来玩。P.S.赖曾濂、雷胜军、王睿健他们已经尝了鲜,基本都是输过几十盘后找出了一些规律就赢了。不过,我已经想到了对付此类人的办法,嘿嘿(^o^)/
Mining Massive Data Sets
前段时间,我们实验室小团队开始了CS246的集体学习,这是一堂由Jure讲授的偏理论的数据挖掘课程,虽然偏理论,但是Stanford课程都有很多实践环节,家庭作业依然有不小的编程量,尤其是很多算法,如果我们不试着去编写,实在是很难直观地去领悟。
从Map reduce开始,了解简单的word count在HDFS集群上是如何组织和运算的。然后开始了关联规则(Associate Rules)的探究,重点讨论了Apriori 算法和PCY算法,在PCY算法中,hash表的强大就已经显现了出来,更不用说我们接下来继续深入地讨论了Locality Sensitive Hashing,一种用特征压缩的方式,直接查找哈希表就能判定item之间的相似度的强大方法,它能解决市面上绝大多数定义相似度的函数,包括欧拉距离、正弦相似度、汉明距离等等。
只知其然是不够的,我要抓紧时间,把程序给编了,最好能写一些map reduce的程序。