geometro-thermo-dynamics 这个单词真的长。
# 原子系统预训练任务
发现热力学和几何其实是有点关系的。现在通用的原子系统基座模型的预训练方法包括:
- 对原子类型等不变 feature 进行随机 mask.
- 对原子坐标加噪。
其余的方法就是结合多模态信息做对齐,或者预测 homo, lumo 这些基本的量子化学信息。然而,上述的预训练方式都没能在图上反映几何之外的化学信息。(以及几何图能不能更加显式蕴含更多的化学信息?)所以可能需要考虑一些更有趣的模型架构设计方式。
加噪这个任务其实还是很有意思,和虚功原理一样,都是在静态结构上添加扰动,使得可以获得到内在结构信息的方法。虚功原理是采用动力学方法研究静力学问题,对应的使用静力学方法研究动力学问题的是惯性力。但是惯性力是仅在矢量力学中显式存在的。在拉格朗日力学中,实际上对应拉格朗日方程的常数项:
中的项 .
那么,这里的惯性力方法能不能加入到机器学习模型中?似乎感觉就意思不大了。
# 生成和理解的关系
这几天思考在原子系统基座模型中的生成和理解统一的问题,发现这的确是一个困难的问题。特点包括下面两点:
- 生成和理解对应的最优隐空间不是一致的。
- 理解实际上比生成要难得多。
# 生成和理解的 trade-off
对于理解问题,实际上最优的隐空间维度是尽可能高的。因为越高维度的隐空间越可以将各个变量独立出来,便于进行后续的学习。
对于生成问题,最优的隐空间维度是尽可能低的,因为越低的隐空间意味着越接近于数据分布所在的流形,这样随机采样采集到有效表示的概率最大。
# 理解比生成难
理解比生成难,似乎是原子系统基座模型的特点,或者说是现有评价任务所导致的。理解需要依靠分子构象和分子的原子信息来获得分子的物理化学信息,尤其是宏观信息。这些信息和输入之间的 gap 是比较大的。因此理解困难。
对于生成,无条件生成是相对比较容易的,因为生成的实际上就是结构信息。但对于可控的生成,目前的效果还没有很好。这似乎也是因为目前的理解任务的效果还不够所导致的。
# 几何热力学
几何热力学似乎是一个很有意思的方向,但是和不能确定和机器学习的结合有多么紧密。
# Reference
- Geometrothermodynamics - Wikipedia
- Thermodynamics-informed graph neural networks
- Reversible and irreversible bracket-based dynamics for deep graph neural networks
- Accelerating the design of compositionally complex materials via physics-informed artificial intelligence
- 学好微分几何,热统不再挂科 - 奶牛小雪球的文章 - 知乎
- 现在热力学已经研究透了吗? - 一童天下的回答 - 知乎
- 两种物相接触面(如两种固态材料接触面,或是固 - 液表面)性质的机器学习模型 - Pasa