post_img

这三句话,一定要常说!

摘要

新年伊始,我想和年轻人分享三句话。这三句话,就像三句神奇的咒语,关于成长、关于协作,会让我们发生重大改变。 我不会,我可以学 “我 …

post_img

从Policy Gradient到REINFORCE++

摘要

强化学习的核心目标是通过不断调整策略(即根据当前状态选择动作的规则),使智能体表现得更好。在强化学习中,有几个关键元素至关重要:首 …

post_img

给父亲200次“公主抱”

摘要

01 大学毕业后在南京工作两年后,我辞掉工作,退掉租的房子,准备回家考研。那时,母亲要上班,平时不在家,想到要长期和父亲共处一室, …