Tantai Qianer = 澹台千儿

2024-07-04 467 字 1 分钟

# Intro 用的参考资料主要是 Reinforcement Learning: An Introduction (2nd Edition). 这本书是强化学习领域的经典教材。 # 概念强化学习 (Reinforcement Learning, RL) 是一种从交互 (interaction) 中实现的，目标导向的 (goal-directed) 机器学习方法。强化学习的许多问题描述依赖动力系统 (dynamical systems) 的相关内容。 # 强化学习的元素强化学习使用马尔可夫决策过程 (Markov Decision Process, MDP)...

more...

2024-06-29 1.5k 字 1 分钟

四川游记

锦城虽云乐，不如早还家。

more...

2024-06-21 409 字 1 分钟

Neural Combinatorial Optimization 简单总结

看点同学曾经研究的 NCO 问题，期待能与我的科研方向碰撞得到新的火花。

more...

2024-06-01 1.5k 字 1 分钟

社会学读书随记

more...

2024-05-29 261 字 1 分钟

社会学的摸爬滚打

more...

2024-05-26 807 字 1 分钟

群表示论(1)：引言

感觉还是需要一些群表示论的知识，然后就听了丘维声老师的群表示论网课。不同于前，这次网课几乎是快进着听的。

more...

2024-05-23 147 字 1 分钟

关于英式中文

最近因为 ddl 的缘故，好久没有更新我的 blog 了，今晨 NIPS 赶完，虽然仍是答辩 ddl，但总算有闲心写点东西记录一下最近的想法和趣事。今天在某乎上刷到了一个很有趣的问题，就是如何减少 “的” 的使用，原贴已经找不到了。不过还记下了作者推荐的一篇文章，即余光中的《论中文的常态与病态》。抽空仔细读读。

more...