斯坦福回应抄袭清华系大模型 公开道歉并删除推文

斯坦福大学的一个AI团队在 5 月 29 日发布了一个名为Llama3-V的多模态大模型,并宣称只需 500 美元就能训练出一个性能与GPT4-V相媲美的模型。然而,该模型随后被指控抄袭,与国内由面壁智能和清华大学自然语言处理实验室联合推出的大模型MiniCPM-Llama3-V 2. 5 存在极高的相似度。

面壁智能的CEO李大海和联合创始人刘知远对此事件先后发表回应,认为尽管这在某种程度上可以看作是他们成果得到了国际团队的认可,但他们更希望建立一个开放、合作、有信任的社区环境。目前,斯坦福的团队已经公开道歉,并删除了相关库和官宣推文。

Llama3-V模型在社交媒体上迅速走红,并一度登上了HuggingFace趋势榜首页。但随后,一名网友发现Llama3-V与MiniCPM-Llama3-V 2. 5 在结构、代码、配置文件上几乎一模一样,仅有变量名被替换。网友在面壁智能GitHub的项目下展示了一系列证据。

刘知远教授在知乎上回应称,MiniCPM-Llama3-V 2. 5 在研发时内置了一个彩蛋,即对“清华简”的识别能力,而Llama3-V模型也展现出了一模一样的能力。清华简是清华大学收藏的一批战国竹简,为战国中晚期文物。刘知远透露,识别清华简是MiniCPM-Llama3-V 2. 5 的一项实验功能,训练图像是最近从出土文物中扫描并标注的,且尚未公开发布。

遭到质疑后,斯坦福团队成员删除了官宣模型的推文,并将项目在Github和HuggingFace上的库一并删除。团队成员森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台上向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型撤下。

李大海在声明中表达了对此事的深切遗憾,并强调应该构建一个开放、协作且充满信任的技术社区环境。他们希望团队的努力和优秀工作能够吸引更多人的关注和认可,但并非以被模仿或抄袭的方式。

斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也发文谴责这一抄袭行为。

面壁智能首席科学家刘知远表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。

面壁智能成立于 2022 年 8 月,由李大海担任CEO,曾国洋为法定代表人,注册资本约52. 46 万人民币。公司已完成两轮融资,由知乎、智谱AI等投资。李大海毕业于北京大学数学系,曾任Google中国创始员工之一,后在知乎担任合伙人、CTO。刘知远是清华大学计算机系长聘副教授,智源青年科学家,主要研究方向为自然语言处理、知识图谱和社会计算。

返回顶部