732 1 分钟

# Intro 用的参考资料主要是 Reinforcement Learning: An Introduction (2nd Edition). 这本书是强化学习领域的经典教材。 # 概念 强化学习 (Reinforcement Learning, RL) 是一种从交互 (interaction) 中实现的,目标导向的 (goal-directed) 机器学习方法。强化学习的许多问题描述依赖动力系统 (dynamical systems) 的相关内容。 # 强化学习的元素 强化学习使用马尔可夫决策过程 (Markov Decision Process, MDP)...
807 1 分钟

感觉还是需要一些群表示论的知识,然后就听了丘维声老师的群表示论网课。不同于前,这次网课几乎是快进着听的。

147 1 分钟

最近因为 ddl 的缘故,好久没有更新我的 blog 了,今晨 NIPS 赶完,虽然仍是答辩 ddl,但总算有闲心写点东西记录一下最近的想法和趣事。 今天在某乎上刷到了一个很有趣的问题,就是如何减少 “的” 的使用,原贴已经找不到了。不过还记下了作者推荐的一篇文章,即余光中的《论中文的常态与病态》。抽空仔细读读。
2.2k 2 分钟

之前很早就买过,但是读不下去。现在突然就感觉很有趣,于是重新开始看了。采用的版本是校图书馆所借三联书店出版社 2013 年第一版。