Hermes Agent抄袭中国团队代码实锤,被锤后回应:你删号
事件背景
近年来,中国AI大模型技术迅速崛起,从闭源到开源,逐渐成为全球开源社区的重要力量。然而,长期以来国际上对中国AI技术存在“抄袭”、“跟随者”等刻板印象。2024年6月,斯坦福大学发布了一份报告称美国在AI大模型领域遥遥领先,但在不久之后,该校团队却陷入一场严重的学术不端风波。
中国清华与面壁智能联合开发的多模态大模型 MiniCPM-Llama3-V 2.5(昵称“小钢炮”)在5月底发布后迅速获得关注。这款模型以小巧高效著称,在视觉理解、中文处理、推理能力等方面表现出色。然而,斯坦福大学一个由本科生主导的项目 Llama3-V 被曝出与 MiniCPM-Llama3-V 2.5 高度相似,引发广泛质疑。
抄袭实锤与证据链
6月初,X平台用户 @yangzhizheng1 发文指出,斯坦福团队发布的 Llama3-V 模型在结构、代码、配置文件等方面与 MiniCPM-Llama3-V 2.5 几乎如出一辙。具体包括:
- 模型结构高度相似,变量名仅作简单修改,其余代码几乎完全复制。
- 使用了 MiniCPM-Llama3-V 2.5 的专有分词器技术,而该技术尚未被广泛公开。
- 模型在处理中文图像场景、识别“清华简”这类战国古文字时,错误方式完全一致,说明训练数据或处理逻辑存在高度重合。
更为讽刺的是,当质疑声不断发酵时,Llama3-V 团队迅速删除了 GitHub 项目页面及 HuggingFace 上的模型发布地址,试图“掩耳盗铃”。
分词器的硬伤
斯坦福团队最初辩称,使用的是面壁智能上一代模型 MiniCPM-V2 的分词器。然而,面壁智能官方指出,MiniCPM-Llama3-V 2.5 的分词器是基于 Llama3 构建并加入了专属 token,理论上不可能在 Llama3 尚未发布时被使用。此外,MiniCPM-V2 与 2.5 版本的文件大小和结构完全不同,进一步证明其抄袭行为。

作者回应与甩锅风波
面对指控,Llama3-V 的两位斯坦福作者 Siddharth Sharma 和 Aksh Garg 并未第一时间公开致歉,反而将项目删除,试图逃避责任。最终在舆论压力下,两人于6月2日凌晨在社交平台 X 上发布道歉声明,表示将撤下所有模型版本。
然而,他们的道歉并未平息争议,反而引发新一轮批评。两人将责任归咎于一名来自南加州大学的开发者 Mustafa Aljadery,称其为“代码搬运工”,并表示他们仅负责宣传。这种“甩锅”行为被网友讽刺为“有福同享,有难你当”。
斯坦福官方态度
斯坦福AI实验室主任 Christopher David Manning 公开谴责该团队的行为,称其“典型地不承认错误”,并赞扬了面壁智能 MiniCPM 的技术实力。这一事件也对斯坦福大学的学术声誉造成了一定影响。
中国大模型地位的上升
这一事件不仅揭开了学术不端的阴暗面,也反映出中国大模型在技术上的快速进步。MiniCPM 系列模型以其高性能、低资源消耗赢得了开源社区的认可。面壁智能 CEO 李大海在回应中表示,尽管与顶尖模型仍有差距,但中国团队的创新已不容忽视。
中国团队的开放姿态
在事件发酵后,面壁智能宣布将 MiniCPM 系列模型免费公开,鼓励学术研究与技术共建。对于商业使用,只需填写简单问卷即可授权。这种开放合作的态度获得不少网友点赞,认为中国AI正从“模仿者”向“贡献者”转变。
国际认可与反思
Google DeepMind 研究员 Lucas Beyer 表示,中国开源社区正在做出令人惊叹的成果,但国际上往往忽视了这些贡献。此次事件也促使外界重新审视中国大模型的技术价值和开源生态的活力。
事件影响与未来展望
此次抄袭风波震动了整个AI社区,反映出开源环境下学术诚信的脆弱性。同时,它也推动了中国大模型在全球视野中获得更多尊重与关注。
开源社区呼唤信任与规范
该事件暴露了当前开源社区在知识产权、技术归属、学术规范方面的漏洞。多位业内人士呼吁建立更加透明、规范的开源机制,保护原创者的劳动成果。
中国大模型走向世界舞台
从清华、面壁智能到智谱AI、昆仑天工,中国AI团队正以开放的姿态参与全球竞争。正如李大海所说:“希望大家共建开放、合作、有信任的社区环境。”这次“被抄袭”的事件,某种程度上标志着中国大模型已经站在了世界舞台中央。
结语
这起风波不仅是学术丑闻,更是一次转折点。它打破了“中国只会抄袭”的旧印象,也警示全球AI研究者:创新不易,学术诚信不可弃。