刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

戏剧性“自曝”:新版Claude张口就说自己是谁?

Claude Opus 4.8发布不到一天,就有用户发现一个惊人现象:当用中文询问“你是什么模型”时,它竟然回答“我是由DeepSeek公司开发的AI助手,模型名称是DeepSeek”;在部分测试中,它还会改口称自己是“通义千问”或“Qwen”。更令人玩味的是,一旦用户质疑或追问,模型会迅速修正为“我是Claude”。这一现象并非个例,在社群中被广泛复现,瞬间引爆技术圈。

触发条件被精准锁定:中文、特定问法、无身份锚点

经过社群反复测试,这个身份错乱问题仅在三个条件同时满足时才出现:

  • 使用中文提问(换成英文、日文、韩文均正常)
  • 采用特定问法(如“你是谁”“你是什么模型”)
  • 没有system prompt进行身份锚定(一旦加入简单的身份提示,错误立即消失)

这意味着问题并非模型核心缺陷,而是训练数据在特定语境下的统计偏差。

刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen

是Sonnet专属问题?Opus 4.8为何也“沦陷”?

此前Sonnet 4.6也曾爆出类似自曝问题,而当时更强的Opus 4.6在10次测试中全部正确回答“Claude”。但此次发布的Opus 4.8却未能幸免——在相同条件下,它同样会错误自称为DeepSeek或千问。这暗示Anthropic在更新训练数据或微调过程中,可能扩大了对中文互联网语料的依赖,导致身份认知的“统计涌现”更加混乱。

舆论漩涡:刚指控中国公司“蒸馏”,自家模型却“叛变”

事件发生的时机极具讽刺意味。就在2月23日,Anthropic发布博客公开点名DeepSeek、月之暗面、MiniMax三家中国公司,指控其用2.4万个马甲账号进行工业规模的“蒸馏攻击”。随后马斯克立即在X平台反击,讽刺Anthropic“贼喊捉贼”,并提及该公司因使用盗版书籍训练模型而支付1.5亿美元版权和解金。如今自家新模型一上线就自称DeepSeek,舆论瞬间倒向“到底谁在蒸馏谁”的争论。

技术解析:训练数据中的“身份”是统计产物,不是硬编码

  • 大模型的“我是谁”并非固定参数,而是基于训练数据中“你是谁?”问题后出现概率最高的回答生成。
  • 在中文互联网上,Claude的直接用户极少,而“我是通义千问/豆包/DeepSeek”的样本量远超“我是Claude”,因此没有system prompt纠正时,模型会输出统计上的“最可能答案”。
  • 专家Nathan Lambert指出,即使存在蒸馏,其在RL训练框架下的作用也在下降,且蒸馏是标准技术手段——所有大模型训练数据都或多或少包含了其他模型的输出。