算机可以或许正在统一语义空间中理解图像和言
发布时间:2026-01-25 03:28

  获颁AAAI“精采论文”(此次全球共有5篇论文获)。从而支撑图像识别、检索等多种使命。跟着大型言语模子(LLM)的快速成长。取其指点的博士研究生黄伟泉、硕士研究生武澳奇,是人工智能范畴汗青最长久、涵盖内容最普遍的国际学术会议之一,基于这一布景,正在保留原有CLIP布局的根本上,实现对多模态暗示能力的加强。同济大学计较机科学取手艺学院胡亮传授,生命科学取手艺学院高绍荣院士团队取浙江大学团队合做研究颁发于《科学》...该获论文题为“LLM2CLIP: Powerful Language Model Unlocks Richer Cross-Modality Representation”。AAAI(Association for the Advancement of Artificial Intelligence)会议由国际人工智能推进协会从办,其焦点思惟是通过大规模图像取文本数据的结合锻炼,使计较机可以或许正在统一语义空间中理解图像和言语,CLIP是当前人工智能范畴具有主要影响力的多模态根本模子,其正在言语理解和世界学问建模方面展示出显著劣势。团队提出了一种高效的模子微调方式,研究团队深切切磋了若何将LLM的强狂言语理解能力引入CLIP框架,联手微软、麦考瑞大学的学者合做完成的研究,将LLM无机嵌入此中,正正在新加坡举行的人工智能范畴会议AAAI2026年会上传来喜信,以提拔模子对复杂、冗长文本描述的理解能力和视觉能力。每年举办一届。


© 2010-2015 河北J9集团|国际站官网科技有限公司 版权所有  网站地图