北大&腾讯打造多模态15边形战士!语言作“纽带”,拳打脚踢各模态,超越Imagebind

AI行业动态1年前 (2023)发布 ainavi
11,728 0

北大联合腾讯打造了一个多模态15边形战士!以语言为中心,“拳打脚踢”视频、音频、深度、红外理解等各模态。提出LanguageBind的多模态预训练框架。LanguageBind包含三个部分: 多模态编码器(Multi-modal Encoders),语言编码器(Language Encoder),以及多模态联合学习

© 版权声明

关注公众号,免费获取chatgpt账号
免费获取chatgpt

相关文章

暂无评论

暂无评论...