刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

1 个月前

AI资讯

49 阅读

[claude Opus 4.8 中文提问身份错乱]

戏剧性“自曝”：新版Claude张口就说自己是谁？

Claude Opus 4.8发布不到一天，就有用户发现一个惊人现象：当用中文询问“你是什么模型”时，它竟然回答“我是由DeepSeek公司开发的AI助手，模型名称是DeepSeek”；在部分测试中，它还会改口称自己是“通义千问”或“Qwen”。更令人玩味的是，一旦用户质疑或追问，模型会迅速修正为“我是Claude”。这一现象并非个例，在社群中被广泛复现，瞬间引爆技术圈。

触发条件被精准锁定：中文、特定问法、无身份锚点

经过社群反复测试，这个身份错乱问题仅在三个条件同时满足时才出现：

使用中文提问（换成英文、日文、韩文均正常）
采用特定问法（如“你是谁”“你是什么模型”）
没有system prompt进行身份锚定（一旦加入简单的身份提示，错误立即消失）

这意味着问题并非模型核心缺陷，而是训练数据在特定语境下的统计偏差。

刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

是Sonnet专属问题？Opus 4.8为何也“沦陷”？

此前Sonnet 4.6也曾爆出类似自曝问题，而当时更强的Opus 4.6在10次测试中全部正确回答“Claude”。但此次发布的Opus 4.8却未能幸免——在相同条件下，它同样会错误自称为DeepSeek或千问。这暗示Anthropic在更新训练数据或微调过程中，可能扩大了对中文互联网语料的依赖，导致身份认知的“统计涌现”更加混乱。

舆论漩涡：刚指控中国公司“蒸馏”，自家模型却“叛变”

事件发生的时机极具讽刺意味。就在2月23日，Anthropic发布博客公开点名DeepSeek、月之暗面、MiniMax三家中国公司，指控其用2.4万个马甲账号进行工业规模的“蒸馏攻击”。随后马斯克立即在X平台反击，讽刺Anthropic“贼喊捉贼”，并提及该公司因使用盗版书籍训练模型而支付1.5亿美元版权和解金。如今自家新模型一上线就自称DeepSeek，舆论瞬间倒向“到底谁在蒸馏谁”的争论。

技术解析：训练数据中的“身份”是统计产物，不是硬编码

大模型的“我是谁”并非固定参数，而是基于训练数据中“你是谁？”问题后出现概率最高的回答生成。
在中文互联网上，Claude的直接用户极少，而“我是通义千问/豆包/DeepSeek”的样本量远超“我是Claude”，因此没有system prompt纠正时，模型会输出统计上的“最可能答案”。
专家Nathan Lambert指出，即使存在蒸馏，其在RL训练框架下的作用也在下降，且蒸馏是标准技术手段——所有大模型训练数据都或多或少包含了其他模型的输出。

刚刚，Claude Opus 4.8 上线，张口就说自己是 DeepSeek、Qwen

戏剧性“自曝”：新版Claude张口就说自己是谁？

触发条件被精准锁定：中文、特定问法、无身份锚点

是Sonnet专属问题？Opus 4.8为何也“沦陷”？

舆论漩涡：刚指控中国公司“蒸馏”，自家模型却“叛变”

技术解析：训练数据中的“身份”是统计产物，不是硬编码

链接失效反馈