408 1 分钟

# 自监督学习 本身是 unsupervised learning 的方式,使用数据增强、重构等方式构建标签信号 两大类方法: pretext-task 和对比学习 可以把大量未标注数据用于训练,这样只要模型的规模足够大就 ok,最后就是预训练模型 # 多模态大模型 # 领域适应 一个基本假设是在两个域上的任务是相同的。 领域泛化比领域适应要难,因为领域泛化训练时不能拿到目标的数据。领域适应只是拿不到目标域的标签。 于是领域泛化可以用元学习的思想,将源域中的某些数据当做目标域。 # 小样本学习 包括预训练和元学习两种方式。 元学习的 loss...
253 1 分钟

<!-- moere --> # PyG 概述 # PyG 中的数据对象 PyG 中的数据对象即 torch_geometric.data.Data ,它是一个包含节点特征、边、边特征、图标签等信息的容器。 # PyG Batch PyG Batch 的创建需要使用 collate_fn 函数。该函数将多个 Data 对象合并为一个 Batch 对象。需要注意的是,如果需要重写 collect_fn, 那么需要使用 torch.utils.data 中的 DataLoader ,而不是 torch_geometric.data.DataLoader 。