732 1 分钟

# Intro 用的参考资料主要是 Reinforcement Learning: An Introduction (2nd Edition). 这本书是强化学习领域的经典教材。 # 概念 强化学习 (Reinforcement Learning, RL) 是一种从交互 (interaction) 中实现的,目标导向的 (goal-directed) 机器学习方法。强化学习的许多问题描述依赖动力系统 (dynamical systems) 的相关内容。 # 强化学习的元素 强化学习使用马尔可夫决策过程 (Markov Decision Process, MDP)...
807 1 分钟

感觉还是需要一些群表示论的知识,然后就听了丘维声老师的群表示论网课。不同于前,这次网课几乎是快进着听的。

147 1 分钟

最近因为 ddl 的缘故,好久没有更新我的 blog 了,今晨 NIPS 赶完,虽然仍是答辩 ddl,但总算有闲心写点东西记录一下最近的想法和趣事。 今天在某乎上刷到了一个很有趣的问题,就是如何减少 “的” 的使用,原贴已经找不到了。不过还记下了作者推荐的一篇文章,即余光中的《论中文的常态与病态》。抽空仔细读读。
2.2k 2 分钟

之前很早就买过,但是读不下去。现在突然就感觉很有趣,于是重新开始看了。采用的版本是校图书馆所借三联书店出版社 2013 年第一版。

156 1 分钟

赶论文过程中突然闲了下来,于是开始思考如何读书 / 记笔记。其实对于不同类型的书籍和阅读的目的,需要使用的阅读和笔记技巧完全不同。然而,在网上却很少给出一些可靠的答案(特指 b 站)。不过记笔记还是可以简单总结为三类: 摘抄法:仅摘抄 结构式笔记:总结文章 / 书籍结构,记录关键内容 辩论式笔记:加入交叉引用,记录不同观点 没了。