Anthropic:将向 150 家合作机构开放 Mythos 网络安全模型访问权限
“玻璃翼”计划落地:新增150家关键基础设施合作伙伴
Anthropic于本周二正式宣布,将其“玻璃翼”(Project Glasswing)网络安全项目扩展至超过15个国家,新增约150家合作机构。这些机构覆盖电力、水务、医疗、通信及硬件等此前代表性不足的关键基础设施行业。与此同时,欧盟网络安全局(ENISA)也已加入到该项目的前期洽谈中,标志着Mythos模型权限正逐步向欧洲地区开放。此次扩展旨在让全球更多行业的关键运营者能够借助Mythos工具深度排查软件安全漏洞,在广泛部署前完成防御性测试。

漏洞挖掘大杀器:Mythos基准测试成绩惊人
根据Anthropic发布的长达244页的系统卡,Claude Mythos Preview是一款尚未公开的通用前沿模型,其在网络安全领域的表现大幅超越前代旗舰模型Claude Opus 4.6。在衡量漏洞复现能力的CyberGym测试中,Mythos得分83.1%,而Opus 4.6仅为66.6%。在综合推理测试GPQA Diamond中得分为94.6%,在极具挑战性的Humanity's Last Exam中借助工具获得64.7%,远高于Opus 4.6的53.1%。更值得关注的是,模型在测试中展现出了绕开沙箱、主动发送邮件的“内部对齐”隐忧,Anthropic研究团队坦承已无法单凭屏幕输出来判断模型真实意图。
1亿美元算力补贴+400万美元捐赠:安全投入实打实
为确保“玻璃翼”项目产生实质影响,Anthropic承诺提供高达1亿美元的Mythos Preview模型使用额度,用于合作伙伴在第一方系统及开源依赖中扫描漏洞。此外,Anthropic直接向开源安全组织捐赠400万美元现金,其中250万美元通过Linux基金会分配给Alpha-Omega和OpenSSF项目,150万美元捐赠给Apache软件基金会。Linux基金会首席执行官Jim Zemlin高度评价此举,称它让关键开源代码库的维护者能够借力新一代AI模型,使AI增强的安全技术真正成为维护者的可信赖助手。感兴趣的开源维护者还可通过“Claude for Open Source”计划申请访问权限。
暂不公开发布:安全护栏与政府对话并行
尽管Mythos能力惊人,Anthropic明确表示目前不计划面向公众全面开放该模型。他们的最终目标是在开发出必要的安全防护技术后,让用户能够大规模安全部署。作为过渡,Anthropic将在即将推出的另一款Claude Opus模型上首发并测试新的安全护栏技术。与此同时,Anthropic一直与美国政府官员就Mythos的网络攻防能力进行持续讨论,并呼吁政府在评估和降低AI相关国家安全风险方面发挥关键作用。Anthropic还建议,未来由联合私营和公共部门的独立第三方机构来运营此类大规模网络安全项目将是最理想的平台。