在被誉为“智能体最后考试”的ALE基准测试中,OpenAI的GPT-5.5以24%的通过率险胜Anthropic的Claude Fable 5(22%),后者虽在编程、科研等多项评测中领先,但在这场最严苛的智能体综合测评中遗憾落败。