今天旁听了实习这边项目的答辩,感觉答辩问的问题都很尖锐。在答辩后,又和同组的同学聊了一下。现在来简单总结一下。
首先是项目答辩的问题。项目答辩中,学院领导的意见都在方法论的创新上,秉持的是 AI 的观点,但是项目的同学和老师仍然拘泥于使用别人的模型和方法来进行数值上的计算和模拟。这实际上是思路的不一致。
和同学聊聚焦在几个问题:
- 为什么没能有方法论上的创新?
- 主要原因是交叉学科的同学,大部分都不是 AI 专业的,一方面对模型的具体架构设计原理不熟悉,不知道哪些地方是可以改的。另一方面对代码具有天然的恐惧感,觉得写代码 debug 是很困难的事情。
- 对于项目中懂一点 AI 的同学,实际上也不了解需要加入的物理或化学先验的内容,从而导致无法进一步进行创新。
- 训练势函数的意义?
- 目前训练势函数主要用来进行离子电导率预测,从而进行材料筛选。但是,势函数实际上是用于 MD 加速的过程,计算成本较高,不应该用于材料的初筛。
- 材料筛选的另一个问题是筛选的源头是什么?目前的筛选策略是在已有的材料体系上进行掺杂,从而得到一个组合爆炸的空间,然后进行测试。但这样实际上是可以进行优化的,比如设计奖励函数进行强化学习,或者先进行一个聚类,然后在按簇贪心筛选。
- 生成模型的局限性?
- 其它属性的限制:现在的势函数只能对电导率进行预测。但是决定材料性质的还有热稳定性等诸多因素。如何对多任务进行平衡?
- 生产工艺的不确定性:得到的材料不能确定能否在实际中制造出来。因为不同工艺对材料最后性能具有不同的影响。这些工艺信息很难标准化编码到模型设计当中去。