开云滚球
kaiyun sports 自纪念“搭伙”多模态 中国大模子登上《当然》
发布日期:2026-02-23 13:24 点击次数:122

东说念主民网北京1月30日电 (记者赵竹青)1月28日,智源多模态大模子效果“通过测度下一个词元进行多模态学习的多模态大模子”上线国外顶级学术期刊《当然》。这是我国科研机构主导的大模子效果初度在《当然》正刊发表。
2018年以来,GPT摄取“测度下一个词元(Next-token prediction,NTP)”的自纪念路子,已矣了言语大模子要紧打扰,开启了生成式东说念主工智能波涛。“测度下一个词元”透彻改换了言语模子,促成了如ChatGPT等打扰性效果,并激发了对于通用东说念主工智能(AGI)早期迹象的磋磨。然则,其在多模态学习中的后劲一直不甚开朗。多模态模子主要依赖对比学习、扩散模子等专诚路子,自纪念路子是否不错当作通用路子搭伙多模态?一直是未解之谜。
智源这次提议的Emu3模子,基于“测度下一个词元”的全新多模态模子,将图像、文本和视频搭伙闹翻化到合并个默示空间中,并从零运转,在多模态序列搀和数据上贯串现实一个单一的Transformer架构。这项效果标明,只摄取自纪念路子,就不错搭伙多模态学习,现实出优秀的原生多模态大模子。
《当然》剪辑点评,Emu3仅基于“测度下一个词元”,已矣了大规模文本、图像和视频的搭伙学习,其在生成与感知任务上的性能可与使用专诚路子畸形,这一效果对构建可彭胀、搭伙的多模态智能系统具有遑急意旨。
{jz:field.toptypename/}
备案号: