Anthropic 启动 Project Glasswing 计划,向业界提供 Claude Mythos 模型 1 亿美元调用额度

背景

近年来,随着 AI 技术的快速发展,其在网络安全领域的能力逐渐显现。Anthropic 最新训练出的 Claude Mythos Preview 模型在代码分析和漏洞挖掘方面展现出了远超前代模型的能力。初步测试中,该模型在没有专门网络安全训练的情况下,自主发现了包括 OpenBSD 和 FFmpeg 在内的多个关键系统中潜藏数十年的高危漏洞。

这一发现引发了行业高度关注,因为这些漏洞影响广泛且极难检测。例如,OpenBSD 系统中存在 27 年的漏洞可以被远程攻击导致系统崩溃,而 FFmpeg 中的一行代码漏洞在 16 年间经历了 500 多万次自动化测试却未被识别。

Anthropic 认为,这种强大的漏洞挖掘能力如果不加以管控,可能被滥用为攻击工具。为此,公司决定启动 Project Glasswing(玻璃翅膀计划),通过向经过审核的机构提供模型访问权限,推动全球软件安全的提前加固。

项目详情

Project Glasswing 是一项封闭式合作计划,旨在将 Claude Mythos Preview 模型的能力用于防御目的。目前,该计划的创始合作伙伴包括亚马逊、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达、Palo Alto Networks 和 Anthropic 本身。

  • 调用额度:Anthropic 为这些合作伙伴提供总计 1 亿美元的模型使用额度,用于扫描和修复各自系统中的漏洞。
  • 访问方式:模型通过特定 API 接口分发,仅限于 AWS Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 等专业平台,确保调用的可追溯性和安全性。
  • 价格机制:研究预览期结束后,Claude Mythos Preview 的定价为每百万输入/输出 token 25/125 美元。
  • 开源支持:Anthropic 向 Linux 基金会和 Apache 软件基金会捐赠了总计 400 万美元,用于支持开源社区的安全工作。开源软件维护方可通过 Claude for Open Source 项目申请访问权限。

Anthropic 启动 Project Glasswing 计划,向业界提供 Claude Mythos 模型 1 亿美元调用额度

在漏洞披露方面,Anthropic 承诺在 90 天内发布一份公开报告,详细说明发现的漏洞、修复情况以及实践建议。在此之前,所有漏洞细节将以加密哈希方式保存,确保开发者有足够时间进行修补。

模型能力对比

Claude Mythos Preview 相较于其上一代旗舰模型 Claude Opus 4.6,在多个关键性能指标上均有显著提升:

  • CyberGym基准测试:Mythos 得分 83.1%,Opus 4.6 为 66.6%。
  • SWE-bench Pro(软件修复任务):Mythos 得分 77.8%,Opus 4.6 为 53.8%。
  • SWE-bench Verified(人工验证代码修复):Mythos 93.9%,Opus 4.6 为 69.7%。
  • 多语言支持:Mythos 87.3%,Opus 4.6 为 77.8%。
  • 多模态SWE-bench:Mythos 59.0%,Opus 4.6 仅 27.1%。
  • 命令行执行能力(Terminal-Bench 2.0):Mythos 得分 82.0%,Opus 4.6 为 65.4%。
  • 资源效率:Mythos 的 token 消耗比 Opus 4.6 低 4.9 倍。

这些性能提升表明,Mythos 不仅在漏洞识别方面更为高效,还具备更强的代码生成、逻辑推理和多模态理解能力,使其在网络安全防御中成为强有力工具。

行业影响

Project Glasswing 的推出标志着 AI 在网络安全中从“辅助分析”向“自主攻防”的过渡。这种转变对行业带来了深远影响:

  • 科技巨头的参与:亚马逊、苹果、谷歌、微软等公司加入计划,表明大型科技企业已认识到 AI 在安全领域的战略地位,并愿意协同防御。
  • 开源生态的强化:Linux 基金会等开源组织的加入和资金支持,有助于提升开源软件在安全层面的可持续性。
  • 硬件安全的重视:英伟达和博通等硬件厂商的参与,意味着 AI 安全研究正在向底层基础设施延伸。
  • 金融行业的新动向:摩根大通等金融机构的参与,反映出即使在合规要求严格的行业,AI 也在重塑传统安全理念。

Anthropic CEO 达里奥·阿莫代伊(Dario Amodei)表示,Claude Mythos 的能力代表了 AI 在网络安全领域带来的第一个清晰而紧迫的风险。未来,AI 可能会在生物安全、化学防御等更多领域展现“非预期能力”,因此必须建立透明、协作、先发制人的应对机制。

政策与未来方向

Anthropic 表示已与美国政府相关部门就 Mythos 模型在攻防能力方面展开持续沟通,强调模型不会作为通用聊天机器人对外发布,而是作为专用安全 API 分发。

未来,公司计划通过逐步迭代,在风险可控的前提下推出能力相近但更安全的模型版本。他们首先会在即将发布的 Claude Opus 模型中引入相关安全机制,再推进至更高级别模型。

此外,Glasswing 计划鼓励合作伙伴之间信息共享与最佳实践交流,旨在构建一个全球范围的 AI 驱动安全防御联盟。Anthropic 前沿红队负责人 Logan Graham 指出,这种合作必须扩展为更大规模的集体行动,否则将难以应对 AI 本身带来的安全挑战。


综上所述,Claude Mythos 的推出和 Project Glasswing 的实施,不仅提升了当前软件基础设施的安全性,也预示着 AI 将成为网络安全攻防两端不可或缺的力量。人类社会必须加速构建与之相匹配的防御机制,才能在这场技术变革中保持稳定与安全。