# ByteDance 2024 研究

# Ai4Science

CryoFM: 蛋白质动态大模型。AlphaFold 预测的是蛋白质的静态结构。

DPLM-2: Diffusion Protein Language Model.

# 具身

GR-2: RT-2 没有考虑到未来时间的动作趋势。这里做到了未来一段时间内视觉和动作的共同变化。

# 智能体

PaSa: Paper search agent.

Agent = Executer + LLM + Tools + Memory. LLM = Policy model.

Pasa 包括两个 Agent:

  • Crawler: 基于引文网络迭代查询新的论文
  • Selector:

# 多模态

CLASI: 同传翻译。是一个 end-to-end 模型。同传包括几个问题:

  1. 听到内容不清晰情况下的鲁棒性
  2. 翻译时机的选择
  3. 借助外部信息的方式

PixelDance: 视频生成。挑战:

  1. 一致性
  2. 高动态
  3. 物理规则
  4. 指令遵循

# 字节科研 QA

  1. 如何权衡业务和科研?足够大的公司可以撑得起足够大的项目。要依据确定性高低和耗费资源的多少权衡。
  2. 字节如何看待 R1 火了?字节不会因为媒体反馈做基础方向的调整。
  3. 公司如何看待 AI4Science 发展前景?会不会作为未来的发展目标?bamboo
  4. 字节为什么造芯片?
  5. 字节招聘科研人员会看重哪些?
  6. 校企合作有必要吗?从业界角度来看,与学术界合作在人才、技术上都有帮助。

# 大模型可信 Yinpeng Dong Tsinghua

AI Risk Mangement Should Incorproate Both Safety and Security, 2024.

  • Safety: 模型本身的问题,如偏见等。
  • Security: 面对攻击者的风险是否会放大。如数据投毒,模型窃取等。