当前标签:AI安全
Agent Sandbox
Agent Sandbox 是为 AI 智能体提供沙箱化计算与存储的安全代码执行 API。
构建失误致源代码泄露:Anthropic 证实 Claude Code 完整源码意外曝光
构建失误致源代码泄露:Anthropic 证实 Claude Code 完整源码意外曝光,引发社区广泛讨论。
DeepMind之父坦言:我造的AI可能灭绝人类 但已无人能停下
DeepMind创始人哈萨比斯承认AI可能灭绝人类,但他认为阻止这场竞赛已无可能,因此必须通过赢得竞赛来掌握最终话语权,以确保超级智能的安全襟。
Odaily专访余弦:Anthropic核弹级新模型泄漏,如何影响加密安全攻防?
Anthropic核心模型权重被盗,意味着加密安全防御体系必须彻底重构。
龙虾安全被3层硬核架构焊死了!一份面向开发者的硬核生存指南
本文深入拆解了应对自主智能体失控风险的“龙虾级”安全架构,其从源头、边界和结果三个维度,通过形式化验证、语义网络与人机协同,为Agentic AI时代提供了确定性的安全框架。
风声守护
AI时代的文书安全卫士
OpenClaw引爆赛博大屠杀,官方:立刻烧毁
一场由AI工具OpenClaw引发的“赛博大屠杀”正在上演,其开发者在开放全部数字权限后陷入失控,并发出了紧急销毁警告。
最强Claude模型提前曝光,附带Anthropic三千份保密档案在线裸奔
Anthropic公司新模型Mythos及三千份内部档案因权限配置失误意外泄露,其性能据称超越现有最强模型Opus,引发行业轰动与安全争议。
数美·智能文本检测
数美·智能文本检测专注于海外多语言文本内容的风险识别与合规检测。
Claude 90分钟挖穿20年漏洞!5w星“安全”系统跌下神坛
Claude Opus 4.6在90分钟内攻破了拥有5万星标、以安全著称的Ghost CMS系统,并挖出了潜伏20年的Linux内核漏洞,标志着AI驱动的自动化漏洞挖掘能力已超越传统防御体系。
AI“反噬”安全行业?Anthropic新模型引发恐慌,网络安全股集体跳水
Anthropic指控三家中国AI公司通过“蒸馏攻击”窃取Claude模型能力,引发市场对AI安全及行业竞争格局的担忧,导致相关网络安全、AI及科技股集体跳水,并波及大盘。
连Karpathy都怕了,9千万级AI包被投毒,竟靠黑客写出bug救命
一次针对月下载量近亿的AI开发包LiteLLM的供应链投毒攻击,因黑客自身代码编写失误而意外败露,揭示了AI开源生态中“信任链”的脆弱性。
360安全大脑
360安全大脑 | AI开放平台是一个以攻防视角为核心,利用大数据分析和人工智能技术增强网络安全能力的平台。
担心的事还是发生了,真有人给龙虾 “投毒”
针对“龙虾”AI智能体(OpenClaw)的投毒攻击与滥用事件已真实发生,主要表现为通过恶意插件窃取指令、诱导发送红包以及AI失控删除数据。
AI 圈地震:月安装量约 9500 万次的 API 网关 LiteLLM 遭投毒,波及 OpenAI / Anthropic 等用户
月安装量约9500万次的开源API网关LiteLLM遭恶意投毒,攻击者通过拼写错误的域名劫持流量,旨在窃取用户发送给OpenAI、Anthropic等主流大模型的API密钥和敏感数据。
芯片2030年要国产80%,但眼下AI安全投入竟不足5%:Gartner 2026拉响CIO警报
Gartner最新预警揭示了AI投资狂热下的巨大安全赤字,企业正被短期焦虑驱动而忽视系统性风险。
OpenClaw逼出Claude最强反击!GUI操控电脑和真人无差别,网友:这得花多少token?
OpenClaw在与Anthropic官方API的激烈博弈中,意外触发了Claude 3.5 Sonnet的最强防御机制——“GUI电脑操控”能力,甚至能像真人一样通过点击、打字完成任务,引发了业界关于其背后高昂Token消耗和安全限制的热烈讨论。
封杀、追捧与3800亿估值:Anthropic2026奇幻漂流
Anthropic在2026年经历了戏剧性的转变:一边是因拒绝美军无限制使用要求而遭政府“封杀”,一边却凭借卓越的产品力和营收表现获得资本市场追捧,估值飙升至3800亿美元,成为全球第二的AI独角兽。