没听课后来补的。

目前的多模态大模型在视频处理上仍然表现很差,例如 GPT-4 等。

# 传统 DA 方法

提取特征之后,使用简单的分类器,然后对两个概率分布进行对齐。这是最基本的 DA 方法。

#