当前标签:诚实度
Anthropic发布Claude Opus 4.8,重点是:“我不会骗你”
Anthropic发布Claude Opus 4.8,重点提升“诚实度”,模型更愿主动承认不确定性而非强行作答,缺陷遗漏概率降至前代的四分之一,同时新增可调思考强度、动态多智能体工作流等系统级升级。
Opus 4.8:一个不太诚实的模型
Anthropic声称Claude Opus 4.8比前代更“诚实”,但“诚实”本身成为最难验证的指标——模型糊弄你的成本几乎为零,而你必须重新检查才能确认它是否真的说了实话。
Claude 4.8炸场!部分能力超过Mythos,支持数百子智能体并行
Anthropic发布Claude Opus 4.8,引入可调思考强度与动态工作流,支持数百子智能体并行,诚实度大幅提升,部分对齐指标媲美Mythos预览版。