AI 精神病的巅峰：Claude Mythos 和 OpenAI Spud 还没上线，就有人度假都睡不着了

3 个月前

AI资讯

87 阅读

Anthropic OpenAI][AI模型竞争 AI安全能力

Anthropic 和 OpenAI 最近围绕即将发布的新一代AI模型展开了激烈角逐，即便这些模型尚未正式上线，已经引发行业广泛关注与焦虑。尤其是 Claude Mythos 和 OpenAI 的 Spud（可能为 GPT-5.5），两者尚未现身，却已在技术圈和投资界掀起波澜。

背景：AI安全能力的竞赛愈演愈烈

近年来，AI在网络安全领域的潜力逐渐被挖掘，从代码审计、漏洞识别到逆向工程，AI模型的“防御能力”成为企业与研究者争夺的关键资源。Anthropic 与 OpenAI 作为两大头部玩家，相继宣布将推出具备更强网络安全能力的模型。

Anthropic 首先将 Claude Mythos 仅开放给少数企业，声称其过于强大和危险，无法全面发布。这一策略被外界解读为“饥饿营销”与风险叙事的结合。紧随其后，OpenAI 推出 GPT-5.4-Cyber，作为对抗 Mythos 的“先锋”，并透露 Spud 模型（可能为 GPT-5.5）已在闭门测试中，性能令人震惊。

模型详情：GPT-5.4-Cyber 与 Mythos preview 的对比

GPT-5.4-Cyber
- 基于 GPT-5.4 微调，专注于防御性网络安全任务
- 新增了二进制逆向工程能力，可分析编译后软件的安全性
- OpenAI 采取“渐进式开放”策略，首批面向安全厂商与研究人员
- 附带零数据留存（ZDR）限制，尤其在第三方平台使用中更为谨慎
Claude Mythos
- 仅向少数公司开放，强调其“太强太危险”
- 在多项基准测试中超越 Claude Opus 4.6
- 但其“漏洞发现”能力被质疑夸大，部分成果集中在老旧无实际意义的软件中
- 人工复核数量有限（仅198次），引发对其实际效能的怀疑

市场反应：焦虑情绪蔓延，甚至影响个人生活

尽管 Mythos 和 Spud 还未正式上线，但其“预期”已对行业心理造成强烈冲击。多位开发者和AI博主表示，因担心落后于技术浪潮，焦虑情绪加剧。

有用户在 Reddit 上自曝：“Claude Mythos 的消息让我连度假时都睡不着，生怕自己落后了。”
AI博主 Matthew Burman 也表示，这次似乎“不一样”，担心AI安全能力突飞猛进会带来不可控后果
Anthropic 的“奥本海默时刻”式宣传被批评为“夸大其词”，甚至有人认为其“擅长制造恐慌而非技术突破”

与此同时，OpenAI 的 Spud 被认为是真正能与 Mythos 竞争的模型，尽管尚未公开，已有闭门测试用户称其性能“令人震惊”，甚至“可能改变整个AI安全格局”。

潜在影响：模型能力分层与定价策略的变化

Anthropic 和 OpenAI 的策略都显示，AI模型的“安全能力”正被分层管理。顶级能力将优先服务于经过审核的机构，普通用户则被限制在较低权限的版本中。

Anthropic
- 推出新一代旗舰模型 Claude Opus 4.7
- 同步发布 AI 设计工具，对标 Gamma 和 Google Stitch
- Mythos 作为“最前沿模型”，被限制使用并配合高价策略
OpenAI
- GPT-5.4-Cyber 是网络安全领域的“探路者”
- 传闻中的 Spud（GPT-5.5）正在测试中，可能使用英伟达 Blackwell 训练
- GPT-6 被提前曝光，上下文窗口高达200万token，价格却仅略高于 GPT-5.4

这些变化反映出AI巨头对模型商业化路径的重新思考：在强调安全性的同时，也在试探市场的承受能力和技术边界。

争议与质疑：AI真的“太强”了吗？

尽管 Mythos 被宣传为“具备改变世界的能力”，但业内专家和研究者并不买账：

漏洞发现能力被质疑夸大
- 多数发现的漏洞存在于不再维护的老软件中
- 实际利用价值有限，仅依靠少量人工复核（198次）
George Hotz 的批评
- 黑客界传奇人物指出，AI发现漏洞的“威胁”被严重夸大
- 现实中零日漏洞稀缺主要因法律限制，而非技术瓶颈
性能不稳定问题
- 用户反馈 Claude Opus 4.6 明显“降智”，甚至不如 Opus 4.5
- 导致 API 请求量暴涨80倍，用户被迫频繁重试以获取有效结果

此外，也有声音质疑 Anthropic 的产品策略：在核心模型不稳定的情况下，却优先开发“/buddy”等花哨功能，被认为“不务正业”。

结语：技术进步 vs 营销炒作

这场尚未开始的“AI精神病巅峰对决”已经搅动市场情绪。Claude Mythos 和 OpenAI Spud 都还未正式上线，却已制造出一种“技术即将失控”的紧张氛围。

无论是 Anthropic 的“有限开放+制造焦虑”，还是 OpenAI 的“能力分层+渐进部署”，都反映出AI巨头们在技术、伦理和商业利益之间艰难平衡。随着 GPT-6 和 Claude Opus 4.7 的发布临近，真正的技术较量或许才刚刚开始。