提前泄露的Claude绝密模型,“救了”苹果、微软和谷歌

背景:AI安全能力的“觉醒”

4月8日凌晨,Anthropic正式公开了Claude Mythos预览版的核心信息。这款原本旨在提升逻辑推理能力的语言模型,在没有接受任何特定网络安全训练的情况下,展现了惊人的代码分析和漏洞识别能力。它的表现不仅震惊了技术界,也促使苹果、微软、谷歌等行业巨头迅速与其合作,启动名为“Project Glasswing(玻璃翅膀计划)”的防御项目。

神秘漏洞的“猎杀者”

Claude Mythos在OpenBSD操作系统中发现了隐藏27年之久的漏洞。该漏洞允许攻击者通过远程连接让这个以安全性著称的系统瞬间崩溃。更令人震惊的是,Mythos还在广泛用于视频流媒体的FFmpeg编解码库中识别出了一行存在16年逻辑错误的代码。这一漏洞此前曾被自动化测试工具扫描超过500万次,但由于无法理解其深层逻辑,始终未能识别。

这标志着AI在网络安全领域的角色发生了质的飞跃——从辅助分析工具变成了具备主动漏洞挖掘能力的“硅基安全专家”。

提前泄露的Claude绝密模型,“救了”苹果、微软和谷歌

性能与效率的双重突破

Mythos不仅在漏洞识别方面表现出色,其整体性能也显著优于上一代模型Claude Opus 4.6:

  • 在CyberGym基准测试中,得分从66.6%提升至83.1%,展现了从“辅助分析”到“自主攻防”的能力跃迁。
  • SWE-bench Pro测试得分达77.8%,领先约24个百分点。
  • 在SWE-bench Verified测试中,Mythos获得93.9%的高分,其修复代码不仅正确,还符合高质量工程标准。
  • 多语言支持得分87.3%,多模态测试得分59.0%,远超Opus 4.6的27.1%。
  • Terminal-Bench 2.0测试中,得分从65.4%跃升至82.0%,在4小时超时测试中更是达到92.1%。

值得一提的是,Mythos在性能提升的同时,资源消耗却显著下降——token消耗量仅为Opus 4.6的1/4.9,这对于依赖大规模AI推理的企业来说,意味着极大的成本优化空间。

玻璃翅膀计划:一场全球防御协作

为了防止Mythos的攻击能力被滥用,Anthropic联合亚马逊、苹果、微软、英伟达等40家行业巨头,紧急启动了“Project Glasswing(玻璃翅膀计划)”。该项目向合作伙伴提供1亿美元的Mythos预览版使用额度,旨在帮助他们在漏洞被公开前完成修复。

Anthropic还向Linux基金会、Apache软件基金会等开源组织捐赠400万美元,凸显了开源软件在全球基础设施中的核心地位。Mythos不会作为通用聊天机器人上线,而是以专用安全API的形式,通过AWS Bedrock、谷歌云Vertex AI等平台分发,确保每一笔调用都可追溯、受监管。

该计划建立了一种新的漏洞披露范式:在模型公开技术细节前,给开发者90天时间秘密修复。这种机制在AI日益强大的背景下,为防御者争取了宝贵的缓冲期。

风险与未来:从代码到世界的边界

Anthropic CEO达里奥·阿莫代伊对Mythos的能力表示担忧,认为它揭示了AI可能带来的“第一个清晰而紧迫的风险”。随着AI推理能力的提升,其可能在生物安全、化学防御、关键基础设施等更广泛的领域展现出“非预期能力”。

Glasswing计划的核心意义在于它为全球AI安全协作提供了可行框架。正如前沿红队负责人洛根·格雷厄姆所说:“如果这只是一个封闭的小圈子游戏,那它注定失败。它必须扩展成一个更大规模的生态系统。”

这也意味着,靠人力和时间堆砌安全体系的时代已经终结。未来的网络安全,必须依赖AI自身来构建防御体系。在漏洞被识别和利用的时间差日益缩小的今天,唯有以AI治AI,人类才能在这场数字对抗中掌握主动权。