让大模型不再一次性输出分割掩码,而是像人一样“边看边改”,通过观察、推理、调用工具、读取反馈并迭代修正,最终将视觉分割准确率直接提升9%。
长文问答准确率提升17%后,Anthropic将“不乱猜”作为核心卖点,强调模型输出的真实性和可控性。