文章列表

1.7k 2 分钟

# 混合高斯分布 不管 σ,μ\sigma, \muσ,μ 如何变化,使用高斯分布都是单峰的,因此在概率的估计上具有局限性。一种最简单的想法就是使用混合高斯分布,即多个高斯分布的求和: p(x)=∑k=1KπkN(x∣μk,Σk).p(x) = \sum_{k=1}^K \pi_k \mathcal{N}(x|\mu_k, \Sigma_k). p(x)=k=1∑K​πk​N(x∣μk​,Σk​). 其对数似然分布为 log⁡p(D∣π,μ,Σ)=∑n=1Nlog⁡(∑k=1KπkN(xn∣μk,Σk)).\log p(\mathcal{D}|\pi, \mu, \Sigma) =...
1.6k 1 分钟

# 优化算法的分类 零阶优化:只使用函数 f(x)f(x)f(x) 本身 遗传算法 贝叶斯优化 一阶优化:使用函数 f(x)f(x)f(x) 和其梯度 ∇f(x)\nabla f(x)∇f(x) 梯度下降算法 随机梯度下降算法 二阶优化:使用函数 f(x)f(x)f(x)、其梯度 ∇f(x)\nabla f(x)∇f(x) 和其 Hessian 矩阵 ∇2f(x)\nabla^2 f(x)∇2f(x) 牛顿法 拟牛顿法 # 牛顿法 二阶泰勒展开如下: f(xk+dk)=f(xk)+∇f(xk)Tdk+12dT∇2f(xk)dkf(\textbf{x}^k +...
567 1 分钟

传统分子动力学的缺点: 使用积分需要选择很小的 Δt\Delta tΔt. 从而导致计算量大和误差累积。 传统分子动力学是一个 Markov 过程。但是使用生成模型可以避免这个问题。 time-coarsened: 学习一个 τ≫Δt\tau \gg \Delta tτ≫Δt 的相关关系 P(Xt+τ∣Xt)P(X_{t+\tau}|X_t)P(Xt+τ​∣Xt​). 专用的 domain knowledge 不适合用来做 unified model. 小分子的通用模型直接用原子序数作为词表,这与蛋白质词表(氨基酸或者更细致使用 alpha 碳)不同。因此使用 unified model...
212 1 分钟

能不能用 LLM 辅助论文写作?ACM 等有明确要求。ACM 的要求包括: LLM 不能列为作者 使用 LLM 生成的文字需要显式声明,即表明哪一段是由 LLM 生成的 可以用来进行基本的文字处理、语法检查、翻译等,无需进行声明。 对于图(如 pipeline),common knowledge 之外,不可以直接 copy, 最好重绘,否则也需要标注引用。 抄袭非正式发表的内容仍然属于抄袭的范围,例如 arXiv, Wikipedia, 一些 tutorials 等。