杨植麟当主持人的大模型圆桌：张鹏罗福莉夏立雪都放开说了

3 个月前

AI资讯

100 阅读

大模型 AGI 圆桌讨论 o1模型

o1模型：AI思考范式的重大跃迁

对话的焦点毫无疑问集中在OpenAI发布的o1模型上，嘉宾们一致认为这标志着AI能力的一次质变。姜大昕指出，o1最大的意义在于它首次证明了语言模型拥有了类似人脑的“慢思考”即“系统2”的能力。

以往的GPT系列模型主要依赖“预测下一个token”的范式，属于“系统1”的直线型思维；而o1通过引入强化学习（RL），使得模型能够自我反思、纠错并在多条路径中探索，直到找到正确解法。这不仅代表技术上的巨大进步，更被视为AGI分级中迈向L2（推理者）的关键节点。杨植麟也补充道，o1的核心价值在于提升了AI的上限，解决了Scaling Law在未来“scale what”的难题，为行业指明了可扩展的创新路径。

Scaling Law与算力需求的新逻辑

随着o1引入强化学习新范式，对于算力和数据的连锁反应也成为讨论重点。姜大昕分析认为，o1带来了“Test-Time Scaling”（测试时缩放）的概念，这意味着在推理阶段对计算资源的需求将成倍提升。

杨植麟当主持人的大模型圆桌：张鹏罗福莉夏立雪都放开说了

更重要的是，在训练阶段，为了追求通用泛化能力的推理模型，RL训练（尤其是Self-Play）所需的算力可能并不亚于预训练阶段，甚至听说OpenAI在训练中使用了上万张H100。如果RL能像放大器一样提升模型收益，算力的增长可能重新回到平方维度。朱军同样认为，技术进步的曲线越来越陡，AI发展速度并未放缓，反而在加快。

AGI分级与技术路径的哲学思考

嘉宾们还从更宏观的视角探讨了AGI的发展路径。姜大昕提出了L1-L5的AGI分级标准：L1聊天机器人、L2推理者、L3智能体、L4创新者、L5组织者。o1的出现意味着我们正处于从L1向L2跨越的阶段。

杨植麟则分享了更深层的哲学思考，他将AI研发比作攀登一座“无限的雪山”，问题不可避免但可以解决，正是不断解决问题推动了知识边界的拓展。他提到，AI正在从“缸中之脑”（仅在内部推理）走向与世界交互的Agent（智能体），而Agent面临的最大挑战是泛化能力。他认为，未来的突破口可能在于让AI参与自身的研发过程（即L4创新者阶段），通过更AI Native的方式解决泛化难题。

创业者的路径选择与组织范式

作为身处一线的创业者，嘉宾们也谈到了各自的策略。杨植麟强调了Kim K2模型发布背后的思考：面对高质量数据有限的瓶颈，核心目标是提升“Token效率”（Token Efficiency），让模型用一份数据学到两份知识，并重点发展Agentic能力。他还提到，组织管理也可以借鉴强化学习的理念，设定目标和奖励（RL）为主，辅以必要的指导（SFT），以激发团队创造力。

张鹏在总结时提到，o1的发布让行业看到了曙光，虽然通往AGI的路还很长，需要从L2跨越到L3进而改变物理世界，但技术的迭代速度和创新空间已经因为新范式的出现而大大拓宽。

杨植麟当主持人的大模型圆桌：张鹏罗福莉夏立雪都放开说了

o1模型：AI思考范式的重大跃迁

Scaling Law与算力需求的新逻辑

AGI分级与技术路径的哲学思考

创业者的路径选择与组织范式

链接失效反馈