在北大听的学术论坛的简单笔记。论坛的主题是对今年物理化学诺奖 AI 获奖的相关思考。后续我又在先前的速记上做了简单的补充。

# 李新征

李新征老师是北大物院的,研究凝聚态方向,也是本次讲座的主持人。在主持开场环节,他提到两个比较有趣的观点:

  1. 如何在复杂的系统中运用深刻的理论(杨 - 李理论)?
  2. AI 是描述复杂系统的全新工具。

# 张林峰 ——AI4Science 基础设施建设探索与实践

张林峰老师是深势科技创始人和首席科学家,同时也是北京科学智能研究院的院长。他 16 年毕业于北大元培学院,20 年毕业于 Princeton 应用数学系。他的主要科研成就是 2020 年在 de novo 前提下使用机器学习将分子动力学模拟的极限提高到一亿原子数量级,并获得了 ACM 高性能计算领域的最高奖 —— 戈登贝尔奖。

# 科学研究的范式

  • Kepler 范式:数据驱动的范式
    • 对于材料、生物、药物、化工等数据,存在问题
      • 数据收集的效率低下
      • 缺乏有效的数据分析方法
  • Newton 范式:物理模型范式
    • 大部分的物理问题和所有的化学问题在原理上已经解决,剩下的问题在于求解狄拉克方程。问题在于方程太过复杂无法求解。—— 狄拉克

目前,宏观的、“简单” 的问题已经可以得到解决。但是在材料设计等微观领域,仍然难以解决。

简单和复杂问题的分界线是什么?—— 自由度的个数(维度灾难)

Demis Hassabis: 什么是好的选题?

  1. 巨大的组合搜索空间
  2. 清晰的目标函数 / 度量方式
  3. 大量的数据或高效的模拟系统

数据驱动的典型应用 ——AlphaFold2

DeePMD 基于第一性原理(对应的物理公式)设计 loss.

# 新机会

数据积累从量变走向质变。

实验室是否要设计新的底层系统,实现 AI 读文献、做计算和助实验的系统?

# 马滟青 —— 物理与 AI 新时代 解析 2024 诺贝尔物理学奖

马滟青老师是北大物院的杰青,研究的内容是量子场论,现在也在研究人工智能相关的内容。在这次的分享中,他主要介绍了给 AI 模型设计带来启发的物理学规律,以及 AI 如何为物理学做出服务。

# 人工神经网络

对于 y=f(x)y = f(x), 机器编码的工作是已知 f,xf, xyy, 机器学习的工作是已知 x,yx, yf(x)f(x).

万能逼近定理:单一隐藏层可以逼近任意连续函数。

# Physics for AI

# 利用泊松流拓展扩散模型

是 NIPS 2022 上的一篇文章:Poisson Flow Generative Models.

# 平均场理论

#

# AI for Physics

# 王初

central dogma:

DNA \iff mRNA \iff Protain

蛋白质无序折叠区怎么做?主要的问题是没有数据。

AlphaFold 对动态结构预测还很难。