FindShine +

月记[2017.02]

中国1921

写这篇文章的时候,身后的电视正放着6年前上映的电视剧《中国1921》:青年毛泽东在北京前往上海的路上,手里仅有李大钊给的10块钱,只能买到浦口火车站,在火车上还被人偷了皮鞋。身无分文的他毫无惧色,光着脚在浦口找到一家文具店,帮老板做营销写对联,挣够了钱继续前往上海。

这件小事在正史上毫无波澜,插在这里却毫不违和,看完片段满满感动和崇敬。想清楚要去哪,没有条件创造条件也要去。毛泽东的义无反顾跟他的很多朋友不一样,除了愤懑和激情,他还有韧性和冷静,节奏踩得恰到好处,才能避开这么多艰险障碍,把事业往前推进。

央视红剧里,相比抗日和长征,我更喜欢描述老毛青年少年时期的剧本,包括《恰同学少年》和《中国1921》。读高中的时候甚至把《恰》的剧本经典片段拿来朗读,记得当年背《少年中国说》,感觉它是最好的励志散文。《中国1921》里面杨昌济和杨开慧的戏,也非常有趣,对于毛泽东而言,在正面战场的后方,有这么一位明德的导师和知心的恋人,实属大幸。李沁演的杨开慧,虽有点青涩和做作,甚得我心。

跑步健身

过年的时候讲到今年的两个小计划:一是养一只可爱的小猫,二是请个健身私教。一个月过去了,小猫这边还没有进展,只是零星的找了朋友问一下怎么选猫和养猫。好在最近晚上不算太忙,工作日可以抽两个晚上去健身房锻炼,周末再抽个下午去,凑够3次。这个月以跑步为主,每次跑25分钟,3公里加,再到力量区拉练筋骨。

前些天跟一个学妹聊天(这个学妹很热情),她建议我用脚尖触地跑,并且调整腹部呼吸。感觉跑步也是个技术活,要长期能跑下来是需要刻意练习技巧的(画外音:活着真不容易,什么地方都要练习)。从2月中旬下来,这个月累计了15km的跑步,现在能在20分钟内跑进三公里,是一个不错的进步。三月份继续保持,并看看哪里有优秀的教练可以联系。

狼人杀和德州扑克

17日在知乎上参加了一个《德州扑克中如何正确使用数学》的 Live 分享,讲者 SimonS 是个OI、ACM选手,广告算法领域的牛人,现在是一家创业公司算法总监。他讲到狼人杀、德州扑克跟计算广告很像,都是想在长期的交易中保持稳定的盈利,所以很多算法工程师都喜欢这两种游戏。在这个 Live 里面也学到了不少观牌局、识人性(通过概率)的技巧,比如起手牌的优劣,位置的重要性,计算outs和赢率、赔率等等。跟跑步一样,感觉也是人生处处有技巧。

19日,可能是这个月最开心、充实的一天。跟公司十来个狼人杀的小伙伴一起去青芝坞赏梅和打牌,狼人杀玩了一下午,被两对情侣秀了一地恩爱,另有大神凭着精准的记忆和推理能力掌控着全局。最后开车把朋友们一一送回家,并讨论下个月可以去看油菜花,路上聊得也非常畅快,很久没有这种归属感了。

读书

这个月主要在看论文,书没看多少。微信读书上空闲看了本水书《玩命爱一个姑娘》,最近桃花少,就看看别人的爱情故事。感觉是傻人有傻福,爱情有时候是没有对与错、好与坏,只有爱与不爱。有爱的人是幸福的,被爱也是必要的,每一段感情用心对待,就不至于辜负时间。

正如《活着为了讲述》的扉页文:

生活不是我们活过的日子

而是我们记住的日子

我们为了讲述而在记忆中重现的日子

DRL on the way

这个月主要读了两个方向的文章,一是 Social network embedding 的推荐系统,主要想看看跟我们实际业务的结合,以及学学灌水路子;另一个是循环神经网络 Recurrent Neural Network,尤其是 LSTM 模型。其实 LSTM 在15年末就已经大热,我们研究的有些迟了,深度学习中 CNN 一派用于理解空间维度的信息关联,更多做端到端的翻译;RNN一派则是用于记忆和理解时间维度的信息,更多做序列的预测。刚刚接触 RNN 的时候,总把它和强化学习混淆,后来稍微想清楚了:强化学习是一种跟时序关联的样本生成框架,而循环神经网络是刻画时序的模型,两者的分工还是有很大的差别。

在学习RNN的时候,还用 Torch.rnn 来做了一下宋冬野歌词的生成,虽然效果不是特别好(因为训练文本有限、参数调整不熟),感觉是挺神奇的。

董小姐 你看有一天睡眠

你以到笑着

让我的心都是铁打的

谁敢招我我一屁股坐死他啊

胖子的心都是温柔的

当你需要爱的时候

胖子的心都是坚强的

于是我愿见你的家

我错了 我们一个 完美的婚礼

通过这2个月的学习,基本理清了DRL的主要技术,准备周末写一篇文章梳理一番,以作笔记。

Life

Tech

Project