月记[2017.02]

2017-02-28

中国1921

写这篇文章的时候，身后的电视正放着6年前上映的电视剧《中国1921》：青年毛泽东在北京前往上海的路上，手里仅有李大钊给的10块钱，只能买到浦口火车站，在火车上还被人偷了皮鞋。身无分文的他毫无惧色，光着脚在浦口找到一家文具店，帮老板做营销写对联，挣够了钱继续前往上海。

这件小事在正史上毫无波澜，插在这里却毫不违和，看完片段满满感动和崇敬。想清楚要去哪，没有条件创造条件也要去。毛泽东的义无反顾跟他的很多朋友不一样，除了愤懑和激情，他还有韧性和冷静，节奏踩得恰到好处，才能避开这么多艰险障碍，把事业往前推进。

央视红剧里，相比抗日和长征，我更喜欢描述老毛青年少年时期的剧本，包括《恰同学少年》和《中国1921》。读高中的时候甚至把《恰》的剧本经典片段拿来朗读，记得当年背《少年中国说》，感觉它是最好的励志散文。《中国1921》里面杨昌济和杨开慧的戏，也非常有趣，对于毛泽东而言，在正面战场的后方，有这么一位明德的导师和知心的恋人，实属大幸。李沁演的杨开慧，虽有点青涩和做作，甚得我心。

跑步健身

过年的时候讲到今年的两个小计划：一是养一只可爱的小猫，二是请个健身私教。一个月过去了，小猫这边还没有进展，只是零星的找了朋友问一下怎么选猫和养猫。好在最近晚上不算太忙，工作日可以抽两个晚上去健身房锻炼，周末再抽个下午去，凑够3次。这个月以跑步为主，每次跑25分钟，3公里加，再到力量区拉练筋骨。

前些天跟一个学妹聊天（这个学妹很热情），她建议我用脚尖触地跑，并且调整腹部呼吸。感觉跑步也是个技术活，要长期能跑下来是需要刻意练习技巧的（画外音：活着真不容易，什么地方都要练习）。从2月中旬下来，这个月累计了15km的跑步，现在能在20分钟内跑进三公里，是一个不错的进步。三月份继续保持，并看看哪里有优秀的教练可以联系。

狼人杀和德州扑克

17日在知乎上参加了一个《德州扑克中如何正确使用数学》的 Live 分享，讲者 SimonS 是个OI、ACM选手，广告算法领域的牛人，现在是一家创业公司算法总监。他讲到狼人杀、德州扑克跟计算广告很像，都是想在长期的交易中保持稳定的盈利，所以很多算法工程师都喜欢这两种游戏。在这个 Live 里面也学到了不少观牌局、识人性（通过概率）的技巧，比如起手牌的优劣，位置的重要性，计算outs和赢率、赔率等等。跟跑步一样，感觉也是人生处处有技巧。

19日，可能是这个月最开心、充实的一天。跟公司十来个狼人杀的小伙伴一起去青芝坞赏梅和打牌，狼人杀玩了一下午，被两对情侣秀了一地恩爱，另有大神凭着精准的记忆和推理能力掌控着全局。最后开车把朋友们一一送回家，并讨论下个月可以去看油菜花，路上聊得也非常畅快，很久没有这种归属感了。

读书

这个月主要在看论文，书没看多少。微信读书上空闲看了本水书《玩命爱一个姑娘》，最近桃花少，就看看别人的爱情故事。感觉是傻人有傻福，爱情有时候是没有对与错、好与坏，只有爱与不爱。有爱的人是幸福的，被爱也是必要的，每一段感情用心对待，就不至于辜负时间。

正如《活着为了讲述》的扉页文：

生活不是我们活过的日子

而是我们记住的日子

我们为了讲述而在记忆中重现的日子

DRL on the way

这个月主要读了两个方向的文章，一是 Social network embedding 的推荐系统，主要想看看跟我们实际业务的结合，以及学学灌水路子；另一个是循环神经网络 Recurrent Neural Network，尤其是 LSTM 模型。其实 LSTM 在15年末就已经大热，我们研究的有些迟了，深度学习中 CNN 一派用于理解空间维度的信息关联，更多做端到端的翻译；RNN一派则是用于记忆和理解时间维度的信息，更多做序列的预测。刚刚接触 RNN 的时候，总把它和强化学习混淆，后来稍微想清楚了：强化学习是一种跟时序关联的样本生成框架，而循环神经网络是刻画时序的模型，两者的分工还是有很大的差别。

在学习RNN的时候，还用 Torch.rnn 来做了一下宋冬野歌词的生成，虽然效果不是特别好（因为训练文本有限、参数调整不熟），感觉是挺神奇的。

董小姐你看有一天睡眠

你以到笑着

让我的心都是铁打的

谁敢招我我一屁股坐死他啊

胖子的心都是温柔的

当你需要爱的时候

胖子的心都是坚强的

于是我愿见你的家

我错了我们一个完美的婚礼

通过这2个月的学习，基本理清了DRL的主要技术，准备周末写一篇文章梳理一番，以作笔记。

月记[2017.02]

中国1921

跑步健身

狼人杀和德州扑克

读书

DRL on the way

Life

Tech

Project