“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”6月3日,对于连日来备受关注的斯坦福大学AI团队疑似抄袭面壁智能一事,面壁智能CEO李大海作出回应。同一天,面壁智能联合创始人刘知远也发文回应提到,开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。
风波中心的Llama3-V多模态大模型出自于斯坦福大学的一个本科生团队。几天前,该团队发布这一模型,并宣称只需500美元训练,其性能就比GPT-4V、Gemini Ultra、Claude Opus更强,一度成为“HuggingFace Trending”Top5。但随后,该模型被指抄袭面壁智能发布的MiniCPM-Llama3-V 2.5,且声浪越来越大。
面壁智能是一家“清华系”人工智能大模型创业公司,成立于2022年8月,今年4月刚刚宣布完成新一轮数亿元融资。面壁智能自研了百亿参数预训练语言大模型CPM,MiniCPM是其端侧模型,也被成为“小钢炮”。