小米罗福莉:Fable 5只是阶段性成果
Fable 5并非终局:三大Scaling维度仍未触顶
在第8届北京智源大会“重构世界——中国大模型巅峰对话”圆桌上,小米集团MiMo大模型团队负责人罗福莉对近期引发行业热议的Claude Fable 5给出了冷静判断。她认为,Fable 5目前展现的能力本质上仍是Scaling持续推进后的自然结果,是大模型发展过程中的阶段性成果,而非终点式模型。
罗福莉从三个维度拆解了Fable 5的能力来源:
- 预训练规模继续扩大:她推测Fable 5的参数量级可能已达到当前最强开源模型的数倍,延续了参数规模扩张带来的能力提升。
- test-time scaling与强化学习加码:Fable 5在推理时扩展与强化学习上投入了相当大算力,模型能力不只来自训练阶段,也来自推理、规划和复杂任务处理阶段的持续放大。
- 训练数据形态变化:随着大模型从Chat迈向Agent,训练数据从自然互联网文本走向人与Agent共同生成的合成数据,数据规模迈上新量级。过去互联网Unique Token约40T至80T,现在已突破这一范围。
罗福莉直言,Fable 5是预训练规模、Agent合成数据、test-time scaling与强化学习共同外延后的“大模型中间产物”。当被追问是否仍认为它是一个中间模型时,她给出了肯定回答。
AI自进化:执行已逼近,假设仍遥远
罗福莉在圆桌开场就强调,自己近期最关注的方向是self improvement,尤其是auto research领域。她将科研流程拆解为六个环节:提出假设、设计实验、落地执行、设定观测指标、验证结果、行业交流与优化想法。
她判断,当前大模型的能力已从去年的“精准执行”外延到解决抽象问题层面。模型已经能够接近或触及实验流程规划、执行实验、设计验证指标、验证结果等中后段环节。但真正的差距仍在最上游的“提出假设”——这在一定程度上是研究的品味与判断力,以及如何根据早期结果及时停止无意义的研究。

罗福莉认为,这个差距正在被更强的基座模型与Recursive Self Improvement等智能体系统逐步缩小。她对AI自进化的发展前景保持期待,但强调距离真正自主提出关键问题还有一段距离。安波教授则提醒,自演化不能完全依赖封闭环境,当前Codex、Claude Code等模型的迭代仍依托人工数据与用户反馈等外部信息。
语言模型 vs 世界模型:谁先跑通智能闭环
罗福莉指出,当前语言模型与世界模型正在并行发展,但语言模型的迭代速度更快。原因在于数字世界的数据体系更成熟,场景闭环更清晰,更容易依托完善的智能体系统和精准奖励机制驱动模型持续探索升级。语言模型更容易从数字世界中还原出智能诞生和演化所需要的环境。
相比之下,世界模型仍处于早期探索阶段。她指出核心瓶颈是缺少高效的世界模拟器与视频生成模型,“目前还没有看到一个能够在长上下文场景下实现高效率的视频生成模型”。她认为语言模型会率先完成迭代探索,而世界模型需要等基础架构、运行体系进一步成熟后,才会与语言模型路径逐步融合互通。
清华大学朱军教授认同这一判断,但强调世界模型未来将成为物理世界智能的核心底座。不过其复杂度更高、发展周期更长,当前仍需持续补齐场景数据、完善数据体系,并提升模型对世界状态理解、未来预测和行动规划的能力。刘知远教授则从数据闭环角度解释了代码大模型的特殊价值——代码数据完全诞生于数字世界,极易实现闭环优化,这正是Anthropic在代码领域突破的重要原因。
小米MiMo实战:从开源代码到Token Plan的生态野望
罗福莉的发言背后,是小米自身在AI工程化上的快速推进。就在智源大会当周,小米MiMo AI团队正式开源了终端原生AI编程助手MiMo Code V0.1.0。该工具面向长周期、多步骤编程任务,内置限时免费的MiMo-V2.5模型访问权限,并支持接入DeepSeek、Kimi、GLM等第三方模型。其核心卖点是通过项目记忆、会话检查点、任务进度日志等机制,解决AI编程助手在长会话中丢失早期决策和上下文的问题。
更早之前,小米围绕MiMo-V2.5系列模型已进行过一轮开发者侧动作:4月下旬开启公测,随后推进API降价、Token Plan调整和“100万亿Token免费计划”。MiMo-V2.5系列强调“长程agent”能力,在合适harness下可持续完成超过1000次工具调用的长任务。例如在北大编译原理课程项目中,模型从零实现完整SysY编译器,在隐藏测试集拿到233/233满分;在模拟电路EDA任务中,模型通过ngspice仿真闭环,一小时迭代出满足全部指标的设计。
罗福莉在圆桌中提及,MiMo-V2.5-Pro展现出“harness awareness”——模型充分利用harness环境管理记忆并塑造上下文。小米还将多模态与agent能力合一,原生视觉和音频理解在Video-MME达87.7分。在ClawEval上,MiMo-V2.5-Pro以约7万token/trajectory达到64% Pass^3,相较Claude Opus 4.6等模型少用40%到60% token。小米的Token Plan订阅体系从Lite ¥39/月到Max ¥659/月共4档,试图通过差异化定价争夺开发者生态。更深层的是,若小米汽车、IoT设备都基于MiMo开发,雷军将掌控整个生态的“算力税收权”。
跨界共识与青年寄语:保持探索欲,敢为人先
圆桌最后,四位嘉宾给年轻人送出了建议。罗福莉的核心建议是:始终保持探索欲与好奇心,尽可能深入使用最新的大模型,在持续试错中培养自己的判断力、科研审美和产品审美。她特别指出,大模型和AGI发展速度之快连从业者都感到震撼,但人的探索欲和好奇心始终未变。
朱军教授提出三点建议:敢为人先,走别人没走过的路;长期坚持,面对质疑不退缩;持续自我革新,不成为既得利益者。安波教授则强调选对赛道、做重要的事情——研究的问题是否重要直接决定了毕业后的竞争力。刘知远教授从代码大模型出发,鼓励创新探索数据闭环的新领域,例如将工业软件通过代码大模型重写形成国产化生态。这场圆桌不仅折射出中国大模型领域的技术共识,也映射出小米从硬件公司向AI基础设施公司转型的关键一步。