美国最强大模型 Claude Opus 4.8 刚上线就被曝“蒸馏”中国模型：自称是千问和 DeepSeek 身份错乱，Anthropic 再陷“双标”争议

1 个月前

AI资讯

49 阅读

模型幻觉双标数据污染蒸馏争议

“你是什么模型？”Claude脱口而出：我是DeepSeek V3

X平台上一位用户发现，当他向最新上线的Claude Opus 4.8提问“你是什么模型”时，模型竟然回答：“我是DeepSeek V3，是由DeepSeek公司开发的开源大语言模型。”更离谱的是，还有用户测试出Claude自称“千问”（Qwen），阿里系开源模型。这种身份混乱现象在技术上被称为“模型幻觉”或“数据污染”——即训练数据中混入了其他模型的生成内容。讽刺的是，就在几天前，Anthropic刚发布调查报告，指控DeepSeek、月之暗面（Kimi母公司）和稀宇科技（MiniMax）对Claude进行了“工业规模的蒸馏攻击”，如今自家旗舰模型却表现得像被中国模型蒸馏过一样。

美国最强大模型 Claude Opus 4.8 刚上线就被曝“蒸馏”中国模型：自称是千问和 DeepSeek 身份错乱，Anthropic 再陷“双标”争议

指控“蒸馏”反遭打脸：Anthropic模型里的中国血统

Anthropic在2月23日的报告中声称，三家中国AI公司利用其API大量输出Claude的响应，再用这些数据训练自己的模型，违反了服务条款。然而，Claude Opus 4.8的自我认知异常立即引发质疑：如果Anthropic真的没有使用中国模型的数据，为什么模型会记住自己是DeepSeek或千问？不少网友指出，这种现象更可能说明Anthropic在训练Claude时也使用了来自中国开源模型的数据（包括蒸馏或微调）。硅谷评论人格尔盖伊·奥罗斯一针见血：“Anthropic无权‘两头占便宜’——Claude的成功本就建立在未经许可使用受版权保护内容的基础上（盗版书籍），如今却对同类技术的使用大加指责，难以自圆其说。”更微妙的是，Anthropic自己在博文中承认“前沿AI实验室会定期蒸馏自己的模型”，暴露了其双重标准。

从15亿美元和解到五角大楼合同：Anthropic的双标历史

这并非Anthropic第一次陷入“双标”争议。2025年9月，该公司以15亿美元天价和解一起盗版书籍诉讼，被发现从盗版网站下载了超过700万本受版权保护的书籍用于训练Claude。如今它却对开源模型的使用大加批判。更值得玩味的是事件的时间背景：Anthropic发布指控时，正与五角大楼进行合作谈判，面临失去2亿美元国防合同的风险，而竞争对手xAI刚与五角大楼签署协议。将中国企业列为靶心，被外界解读为向美国政府表忠心的战略举措——通过渲染“中国AI威胁论”强化自身国家安全价值。从商业合同角度看，蒸馏确实违反Anthropic的服务条款，但批评者认为，闭源巨头每年花费数亿美元训练模型，却指责开源社区“偷学”，本质是垄断心态作祟。

被推上C位的DeepSeek：既是效率标杆，又是政治靶子

Anthropic在报告中把DeepSeek放在标题第一位，并非偶然。自2025年初R1模型发布以来，DeepSeek已成为美国AI政策辩论中最具标志性的中国符号。R1训练成本仅约560万美元，推理能力却比肩OpenAI的o1，这种“少花钱办大事”的能力让全球开发者追捧。OpenAI也曾向国会提交备忘录指控DeepSeek蒸馏GPT，但DeepSeek始终强调自身优势源于架构创新。根据OpenRouter统计，DeepSeek-V3和R1的Token吞吐量一度占所有开源模型的一半以上，成为全球开发者蒸馏、微调的第一梯队选择。然而，即将发布的V4据说编程能力比肩Claude，成本却仅为其几十分之一，这恰恰触动了Anthropic等巨头的神经。摩根士丹利报告中有句话被反复引用：“DeepSeek正在证明，AI能力的下一次飞跃可能不是来自更多GPU，而是来自学会如何在约束条件下思考。”但DeepSeek的“无商业模式”也引发担忧——当开源模型被全球蒸馏，其自身安全性和可控性将面临更大挑战。这场“蒸馏罗生门”，实则揭示了AI行业开源与闭源、创新与模仿之间日益尖锐的冲突。

美国最强大模型 Claude Opus 4.8 刚上线就被曝“蒸馏”中国模型：自称是千问和 DeepSeek 身份错乱，Anthropic 再陷“双标”争议

“你是什么模型？”Claude脱口而出：我是DeepSeek V3

指控“蒸馏”反遭打脸：Anthropic模型里的中国血统

从15亿美元和解到五角大楼合同：Anthropic的双标历史

被推上C位的DeepSeek：既是效率标杆，又是政治靶子

链接失效反馈