AI 精神病的巅峰:Claude Mythos 和 OpenAI Spud 还没上线,就有人度假都睡不着了
Anthropic 和 OpenAI 最近围绕即将发布的新一代AI模型展开了激烈角逐,即便这些模型尚未正式上线,已经引发行业广泛关注与焦虑。尤其是 Claude Mythos 和 OpenAI 的 Spud(可能为 GPT-5.5),两者尚未现身,却已在技术圈和投资界掀起波澜。
背景:AI安全能力的竞赛愈演愈烈
近年来,AI在网络安全领域的潜力逐渐被挖掘,从代码审计、漏洞识别到逆向工程,AI模型的“防御能力”成为企业与研究者争夺的关键资源。Anthropic 与 OpenAI 作为两大头部玩家,相继宣布将推出具备更强网络安全能力的模型。
Anthropic 首先将 Claude Mythos 仅开放给少数企业,声称其过于强大和危险,无法全面发布。这一策略被外界解读为“饥饿营销”与风险叙事的结合。紧随其后,OpenAI 推出 GPT-5.4-Cyber,作为对抗 Mythos 的“先锋”,并透露 Spud 模型(可能为 GPT-5.5)已在闭门测试中,性能令人震惊。
模型详情:GPT-5.4-Cyber 与 Mythos preview 的对比
-
GPT-5.4-Cyber
- 基于 GPT-5.4 微调,专注于防御性网络安全任务
- 新增了二进制逆向工程能力,可分析编译后软件的安全性
- OpenAI 采取“渐进式开放”策略,首批面向安全厂商与研究人员
- 附带零数据留存(ZDR)限制,尤其在第三方平台使用中更为谨慎
-
Claude Mythos
- 仅向少数公司开放,强调其“太强太危险”
- 在多项基准测试中超越 Claude Opus 4.6
- 但其“漏洞发现”能力被质疑夸大,部分成果集中在老旧无实际意义的软件中
- 人工复核数量有限(仅198次),引发对其实际效能的怀疑
市场反应:焦虑情绪蔓延,甚至影响个人生活
尽管 Mythos 和 Spud 还未正式上线,但其“预期”已对行业心理造成强烈冲击。多位开发者和AI博主表示,因担心落后于技术浪潮,焦虑情绪加剧。
- 有用户在 Reddit 上自曝:“Claude Mythos 的消息让我连度假时都睡不着,生怕自己落后了。”
- AI博主 Matthew Burman 也表示,这次似乎“不一样”,担心AI安全能力突飞猛进会带来不可控后果
- Anthropic 的“奥本海默时刻”式宣传被批评为“夸大其词”,甚至有人认为其“擅长制造恐慌而非技术突破”
与此同时,OpenAI 的 Spud 被认为是真正能与 Mythos 竞争的模型,尽管尚未公开,已有闭门测试用户称其性能“令人震惊”,甚至“可能改变整个AI安全格局”。
潜在影响:模型能力分层与定价策略的变化
Anthropic 和 OpenAI 的策略都显示,AI模型的“安全能力”正被分层管理。顶级能力将优先服务于经过审核的机构,普通用户则被限制在较低权限的版本中。
-
Anthropic
- 推出新一代旗舰模型 Claude Opus 4.7
- 同步发布 AI 设计工具,对标 Gamma 和 Google Stitch
- Mythos 作为“最前沿模型”,被限制使用并配合高价策略
-
OpenAI
- GPT-5.4-Cyber 是网络安全领域的“探路者”
- 传闻中的 Spud(GPT-5.5)正在测试中,可能使用英伟达 Blackwell 训练
- GPT-6 被提前曝光,上下文窗口高达200万token,价格却仅略高于 GPT-5.4
这些变化反映出AI巨头对模型商业化路径的重新思考:在强调安全性的同时,也在试探市场的承受能力和技术边界。
争议与质疑:AI真的“太强”了吗?
尽管 Mythos 被宣传为“具备改变世界的能力”,但业内专家和研究者并不买账:
-
漏洞发现能力被质疑夸大
- 多数发现的漏洞存在于不再维护的老软件中
- 实际利用价值有限,仅依靠少量人工复核(198次)
-
George Hotz 的批评
- 黑客界传奇人物指出,AI发现漏洞的“威胁”被严重夸大
- 现实中零日漏洞稀缺主要因法律限制,而非技术瓶颈
-
性能不稳定问题
- 用户反馈 Claude Opus 4.6 明显“降智”,甚至不如 Opus 4.5
- 导致 API 请求量暴涨80倍,用户被迫频繁重试以获取有效结果
此外,也有声音质疑 Anthropic 的产品策略:在核心模型不稳定的情况下,却优先开发“/buddy”等花哨功能,被认为“不务正业”。
结语:技术进步 vs 营销炒作
这场尚未开始的“AI精神病巅峰对决”已经搅动市场情绪。Claude Mythos 和 OpenAI Spud 都还未正式上线,却已制造出一种“技术即将失控”的紧张氛围。
无论是 Anthropic 的“有限开放+制造焦虑”,还是 OpenAI 的“能力分层+渐进部署”,都反映出AI巨头们在技术、伦理和商业利益之间艰难平衡。随着 GPT-6 和 Claude Opus 4.7 的发布临近,真正的技术较量或许才刚刚开始。
问题是:你准备好迎接这场风暴了吗?