传统分子动力学的缺点:

  1. 使用积分需要选择很小的 Δt\Delta t. 从而导致计算量大和误差累积。
  2. 传统分子动力学是一个 Markov 过程。但是使用生成模型可以避免这个问题。

time-coarsened: 学习一个 τΔt\tau \gg \Delta t 的相关关系 P(Xt+τXt)P(X_{t+\tau}|X_t).

专用的 domain knowledge 不适合用来做 unified model. 小分子的通用模型直接用原子序数作为词表,这与蛋白质词表(氨基酸或者更细致使用 alpha 碳)不同。因此使用 unified model 的时候需要考虑如何处理不同 domain 的词表。在 UniSim 中直接使用元素周期表作为词表。这样如何挽回被丢失的 domain knowledge 呢?实际上总共定义了两个词表,一个是使用元素周期定义的基础词表 AbRA×HA_b \in \mathbb{R}^{A \times H}, 以及定义在每个原子上的扩展词表 AeRA×D×HA_e \in \mathbb{R}^{A \times D \times H}.

这样产生的问题是离散的难以反向传播。

核心是使用分布来对轨迹进行模拟。

对 MD 进行降维是可以找到一些具体的 pattern 的,这样说明可以使用分布来建模,因此不会陷入混沌。