ITBench-AA - AI 智域导航

首页

登录

当前标签：ITBench-AA

“Agent的最后一场考试”来了：最强模型得分率仅8.6%，Claude Code直接挂零

“Agent的最后一场考试”来了：最强模型得分率仅8.6%，Claude Code直接挂零

最强模型在真实企业操作场景中端到端通过率不足9%，Claude Code直接挂零，AI Agent正面临一场史无前例的“能力雪崩”。