# ByteDance 2024 研究
# Ai4Science
CryoFM: 蛋白质动态大模型。AlphaFold 预测的是蛋白质的静态结构。
DPLM-2: Diffusion Protein Language Model.
# 具身
GR-2: RT-2 没有考虑到未来时间的动作趋势。这里做到了未来一段时间内视觉和动作的共同变化。
# 智能体
PaSa: Paper search agent.
Agent = Executer + LLM + Tools + Memory. LLM = Policy model.
Pasa 包括两个 Agent:
- Crawler: 基于引文网络迭代查询新的论文
- Selector:
# 多模态
CLASI: 同传翻译。是一个 end-to-end 模型。同传包括几个问题:
- 听到内容不清晰情况下的鲁棒性
- 翻译时机的选择
- 借助外部信息的方式
PixelDance: 视频生成。挑战:
- 一致性
- 高动态
- 物理规则
- 指令遵循
# 字节科研 QA
- 如何权衡业务和科研?足够大的公司可以撑得起足够大的项目。要依据确定性高低和耗费资源的多少权衡。
- 字节如何看待 R1 火了?字节不会因为媒体反馈做基础方向的调整。
- 公司如何看待 AI4Science 发展前景?会不会作为未来的发展目标?bamboo
- 字节为什么造芯片?
- 字节招聘科研人员会看重哪些?
- 校企合作有必要吗?从业界角度来看,与学术界合作在人才、技术上都有帮助。
# 大模型可信 Yinpeng Dong Tsinghua
AI Risk Mangement Should Incorproate Both Safety and Security, 2024.
- Safety: 模型本身的问题,如偏见等。
- Security: 面对攻击者的风险是否会放大。如数据投毒,模型窃取等。