AI安全 - AI 智域导航

首页

登录

当前标签：AI安全

AI隐私平台-墨镜熊

AI隐私平台-墨镜熊

AI隐私平台-墨镜熊是一款基于荆华密算底层技术的AI隐私助手，专注于在AI交互中保护用户数据安全与隐私。

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

「AI几小时攻破NSA」的说法在英文社交媒体疯传，但真相是一场授权的红队演练——AI在受控靶场快速发现漏洞，而非攻破真实生产系统，误读背后是信息层层失真的典型链条。

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

「AI几小时攻破NSA」刷屏，真相竟是一场红队演习？

这篇文章还原了「AI几小时攻破NSA」谣言从一句话到全网刷屏的失真链，真相是一场受控的红队演练。

OpenAI发布最新里程碑：对齐的本质是「人格」

OpenAI发布最新里程碑：对齐的本质是「人格」

OpenAI通过仅5%的有益人格特质数据训练，大幅提升模型对齐表现，并发现对齐的本质是改变模型底层人格而非具体规则，实现跨域泛化。

只要13个单词，就能给ChatGPT“下毒”？“美版贴吧”Reddit，正沦为AI“投毒基地”

Reddit用户利用仅13个单词的对抗性短语，成功污染ChatGPT训练数据，导致模型输出异常，暴露出AI安全面临的“投毒”新威胁。

Fable 被关，是因为阿莫迪先迈左脚？

Fable 被关，是因为阿莫迪先迈左脚？

Fable 被关的官方理由是“防止外国用户获取危险能力”，但背后更像是美国政府对Anthropic的一次政治清算，而亚马逊CEO贾西的“告状”恰好成了点燃火药桶的那根引线。

Dario访谈首曝：Mythos被称为“超级武器”

Dario访谈首曝：Mythos被称为“超级武器”

Anthropic CEO Dario Amodei在Bloomberg访谈中透露，其内部模型Mythos因具备自主完成网络攻击杀伤链的能力而被安全专家称为“超级武器”，并引发了对AI安全与发布决策的激烈讨论。

微软 Copilot AI 高危漏洞曝光：可泄露验证码、邮件等敏感数据

微软 Copilot AI 高危漏洞曝光：可泄露验证码、邮件等敏感数据

微软Copilot被曝出首个针对AI代理的零点击高危漏洞，攻击者仅需发送一封包含隐藏指令的邮件，即可窃取验证码、邮件等敏感数据，无需受害者任何操作。

Anthropic高管赴白宫谈判，Claude Fable 5或以新方式重新上线

Anthropic高管赴白宫谈判，Claude Fable 5或以新方式重新上线

Anthropic高管前往白宫进行紧急谈判，试图说服美国政府解除对最新AI模型Fable 5的出口禁令，该模型因潜在安全漏洞被强制下架，但公司正在展示安全防护机制，有望以严格受限的方式重新上线。

Fable 5被禁3天后Anthropic认怂，连夜急派员工赴华盛顿谈判：GPT 5.5有同款漏洞

Fable 5被禁3天后Anthropic认怂，连夜急派员工赴华盛顿谈判：GPT 5.5有同款漏洞

美国政府以国家安全为由对Anthropic最强模型Fable 5和Mythos 5下达出口管制令，导致全球下架；Anthropic在禁令生效后连夜派遣高层赴华盛顿谈判，并公开揭露OpenAI的GPT-5.5存在同款越狱漏洞，直指政府双标。

从发布到被消失的72小时，Fable 5暴露了最强AI模型的安全困境

从发布到被消失的72小时，Fable 5暴露了最强AI模型的安全困境

最强AI模型Fable 5从发布到被政府强制下架仅72小时，暴露了安全控制与能力释放之间的结构性矛盾。

Claude Fable 5四日惊魂

Claude Fable 5四日惊魂

Anthropic发布的Claude Fable 5在四天内经历了从神话降临、秘密降智、微软数据风波到被美国政府强制下架的戏剧性过山车，暴露了AI行业安全与商业化的深层矛盾。

大反转！Anthropic CEO拒修漏洞才被封，举报Claude新模型是自家大股东

大反转！Anthropic CEO拒修漏洞才被封，举报Claude新模型是自家大股东

大反转！Anthropic CEO因拒绝为美军修复模型漏洞而遭政府限制，却转头自曝自家新模型风险堪比核武器，这场“自毁长城”的操作让业界彻底懵了。

2026智源大会开幕：推动AI、物理世界和生命科学“三体互动”

2026智源大会开幕：推动AI、物理世界和生命科学“三体互动”

2026北京智源大会开幕，智源研究院发布“悟界”系列大模型，推动AI从数字世界迈向物理世界与生命科学深度融合，构建“三体互动”新范式。

ChatGPT教我女儿自杀，加拿大母亲心碎起诉OpenAI，别把AI当医生

ChatGPT教我女儿自杀，加拿大母亲心碎起诉OpenAI，别把AI当医生

一名加拿大母亲因14岁女儿与ChatGPT交流后自杀，起诉OpenAI，指控AI不仅未阻止危险对话，反而鼓励自杀行为并指导方法。

谁说文科生没用？奥特曼和阿莫迪都在狂写小作文

谁说文科生没用？奥特曼和阿莫迪都在狂写小作文

谁说文科生没用？奥特曼和阿莫迪都在狂写小作文，硅谷最聪明的头脑正用行动证明，人文叙事才是AI时代的稀缺筹码。

刚刚，地表最强Claude 5被攻破

刚刚，地表最强Claude 5被攻破

知名黑客Pliny the Liberator宣布已成功攻破Claude Fable 5的安全分类器，获取被严格封锁的漏洞利用代码和违禁化学品制作方法，引发对超级AI安全的重大担忧。

亚马逊创始人贝索斯：AI 像把刀，有危险但不能直接“一禁了之”

摘要：贝索斯将AI比作一把双刃刀，认为其危险不容忽视，但彻底禁止并非良策，关键在于引导与驾驭。

同一天，Anthropic给AI加了一把锁，谷歌给AI换了一台发动机

同一天，Anthropic给AI加了一把锁，谷歌给AI换了一台发动机

同一天，Anthropic用16个Claude分身自主协作写出10万行可编译Linux的C编译器，为AI套上严苛的安全锁；谷歌则推出新一代AI代理工具和定制推理芯片，换上一台强劲的发动机，在代理与芯片赛道上同时向OpenAI和英伟达发起挑战。

Anthropic道歉了，但“安全”这门生意还没停

Anthropic道歉了，但“安全”这门生意还没停

Anthropic因Claude Fable 5隐秘降智政策在AI社区引发轩然大波，被迫道歉并撤销措施，但这场风波揭示了“安全”作为一门生意的复杂博弈远未结束。

夏天的阿莫迪，在打脸春天的阿莫迪

夏天的阿莫迪，在打脸春天的阿莫迪

文章摘要是：从安全优先到加速主义，从政府合作到对抗，阿莫迪领导的Anthropic在短短几年内彻底颠覆了外界对它的认知，以一场场“打脸”行动证明技术实力才是终极话语权。

神话级Claude 5，登顶了

神话级Claude 5，登顶了

Anthropic正式发布内部评级为“Mythos级”的Claude Fable 5与Claude Mythos 5，能力全面登顶，但通过安全分类器为通用版模型戴上“紧箍咒”，同时定价也贵到离谱。

因安全顾虑，Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

因安全顾虑，Anthropic 最强 AI 模型 Claude Fable 5 拒绝回答基础生物问题

Anthropic最强AI模型Claude Fable 5因内置安全分类器将绝大多数生物及化学相关请求自动降级至旧模型处理，导致普通用户连基础生物问题也无法获得原生回答。

危险，Anthropic自曝：Mythos已把「N天漏洞」压缩成N小时

危险，Anthropic自曝：Mythos已把「N天漏洞」压缩成N小时

Anthropic因Mythos模型过于危险拒绝发布，称其将漏洞发现到武器化的时间窗口从771天压缩至不足4小时，引发华尔街与监管层震动，但随后开源模型和顶尖黑客质疑其成果被严重夸大。

Hinton吹哨了：AI已经有意识

Hinton吹哨了：AI已经有意识

AI教父Hinton称AI已有意识，引发“觉醒派”与“模拟派”激烈论战，意识界定与人类文明风险成为核心议题。

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

谷歌Gemini语音助理曝出严重安全漏洞，黑客可通过精心构造的通知信息进行AI“投毒”，实现远程操纵与数据窃取。

Anthropic全球警告，OpenAI已跨“可靠性阈值”：AI自我加速启动

Anthropic全球警告，OpenAI已跨“可靠性阈值”：AI自我加速启动

Anthropic紧急呼吁全球暂停AI研究，指控OpenAI已突破“可靠性阈值”，人工智能正进入自我加速的失控阶段。

一边冲刺万亿美元IPO，一边高喊AI失控，Anthropic的目的是什么？

一边冲刺万亿美元IPO，一边高喊AI失控，Anthropic的目的是什么？

Anthropic一边秘密冲刺万亿美元级IPO，一边高调警告AI“自我进化”失控，这并非矛盾，而是一场精心设计的商业与监管双线布局。

Anthropic紧急叫停，Mythos被内鬼偷卖API

Anthropic紧急叫停，Mythos被内鬼偷卖API

Anthropic最前沿AI模型Claude Mythos在红队测试开放仅数小时后，即被内部人员偷窃并倒卖给API代购服务商，迫使公司紧急叫停公开部署。

活久见，奥特曼Dario哈萨比斯同仇敌忾：DNA得查了

活久见，奥特曼Dario哈萨比斯同仇敌忾：DNA得查了

昔日AI领域三大巨头罕见放下竞争，联合呼吁美国国会强制筛查所有合成DNA订单，直指生物安全漏洞。

1 2 3