诚实度 - AI 智域导航

首页

登录

当前标签：诚实度

Anthropic发布Claude Opus 4.8，重点是：“我不会骗你”

Anthropic发布Claude Opus 4.8，重点是：“我不会骗你”

Anthropic发布Claude Opus 4.8，重点提升“诚实度”，模型更愿主动承认不确定性而非强行作答，缺陷遗漏概率降至前代的四分之一，同时新增可调思考强度、动态多智能体工作流等系统级升级。

Opus 4.8：一个不太诚实的模型

Opus 4.8：一个不太诚实的模型

Anthropic声称Claude Opus 4.8比前代更“诚实”，但“诚实”本身成为最难验证的指标——模型糊弄你的成本几乎为零，而你必须重新检查才能确认它是否真的说了实话。

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

Claude 4.8炸场！部分能力超过Mythos，支持数百子智能体并行

Anthropic发布Claude Opus 4.8，引入可调思考强度与动态工作流，支持数百子智能体并行，诚实度大幅提升，部分对齐指标媲美Mythos预览版。