首页
登录
当前标签:ITBench-AA
“Agent的最后一场考试”来了:最强模型得分率仅8.6%,Claude Code直接挂零
最强模型在真实企业操作场景中端到端通过率不足9%,Claude Code直接挂零,AI Agent正面临一场史无前例的“能力雪崩”。