杨植麟当主持人的大模型圆桌:张鹏罗福莉夏立雪都放开说了
o1模型:AI思考范式的重大跃迁
对话的焦点毫无疑问集中在OpenAI发布的o1模型上,嘉宾们一致认为这标志着AI能力的一次质变。姜大昕指出,o1最大的意义在于它首次证明了语言模型拥有了类似人脑的“慢思考”即“系统2”的能力。
以往的GPT系列模型主要依赖“预测下一个token”的范式,属于“系统1”的直线型思维;而o1通过引入强化学习(RL),使得模型能够自我反思、纠错并在多条路径中探索,直到找到正确解法。这不仅代表技术上的巨大进步,更被视为AGI分级中迈向L2(推理者)的关键节点。杨植麟也补充道,o1的核心价值在于提升了AI的上限,解决了Scaling Law在未来“scale what”的难题,为行业指明了可扩展的创新路径。
Scaling Law与算力需求的新逻辑
随着o1引入强化学习新范式,对于算力和数据的连锁反应也成为讨论重点。姜大昕分析认为,o1带来了“Test-Time Scaling”(测试时缩放)的概念,这意味着在推理阶段对计算资源的需求将成倍提升。

更重要的是,在训练阶段,为了追求通用泛化能力的推理模型,RL训练(尤其是Self-Play)所需的算力可能并不亚于预训练阶段,甚至听说OpenAI在训练中使用了上万张H100。如果RL能像放大器一样提升模型收益,算力的增长可能重新回到平方维度。朱军同样认为,技术进步的曲线越来越陡,AI发展速度并未放缓,反而在加快。
AGI分级与技术路径的哲学思考
嘉宾们还从更宏观的视角探讨了AGI的发展路径。姜大昕提出了L1-L5的AGI分级标准:L1聊天机器人、L2推理者、L3智能体、L4创新者、L5组织者。o1的出现意味着我们正处于从L1向L2跨越的阶段。
杨植麟则分享了更深层的哲学思考,他将AI研发比作攀登一座“无限的雪山”,问题不可避免但可以解决,正是不断解决问题推动了知识边界的拓展。他提到,AI正在从“缸中之脑”(仅在内部推理)走向与世界交互的Agent(智能体),而Agent面临的最大挑战是泛化能力。他认为,未来的突破口可能在于让AI参与自身的研发过程(即L4创新者阶段),通过更AI Native的方式解决泛化难题。
创业者的路径选择与组织范式
作为身处一线的创业者,嘉宾们也谈到了各自的策略。杨植麟强调了Kim K2模型发布背后的思考:面对高质量数据有限的瓶颈,核心目标是提升“Token效率”(Token Efficiency),让模型用一份数据学到两份知识,并重点发展Agentic能力。他还提到,组织管理也可以借鉴强化学习的理念,设定目标和奖励(RL)为主,辅以必要的指导(SFT),以激发团队创造力。
张鹏在总结时提到,o1的发布让行业看到了曙光,虽然通往AGI的路还很长,需要从L2跨越到L3进而改变物理世界,但技术的迭代速度和创新空间已经因为新范式的出现而大大拓宽。