2026人类与AGI峰会将于斯坦福举行:全球AI与机器人领军者共议智能时代未来
2026年1月,由清华大学基础模型北京市重点实验室联合主办的人类与AGI峰会确认将于美国斯坦福大学举行。峰会筹备方表示,选择斯坦福这一全球科技创新高地,旨在汇聚真正推动AI与机器人时代到来的关键力量,共同讨论未来十年的技术机会、产业格局与文明挑战。在此前于北京举办的预热闭门会议上,智谱创始人唐杰、月之暗面CEO杨植麟、阿里千问技术负责人林俊旸、腾讯首席AI科学家姚顺雨等核心人物已率先展开了长达三个半小时的坦诚交锋,为斯坦福峰会奠定了议题基调。
唐杰:Scaling是最轻松的偷懒方式,2026年将迎来范式转变
清华大学教授、智谱创始人唐杰在峰会上直言,单纯依靠数据和参数规模的Scaling已逐渐显露瓶颈,“Scaling是一个很好的办法,但可能是最轻松的办法,是我们人类偷懒的一个办法”。他认为,真正值得探索的是让模型具备自主Scaling能力,并回到对人类认知学习过程的理解。唐杰将人类认知分为系统1和系统2——系统1完成95%的日常任务,系统2负责复杂推理。大模型同样需要构建双系统及自学习机制的协同。他提出关键短板:
- 多模态感官:2025年是多模态的适应年,但全球仅少数模型真正引起关注。2026年多模态被视为重点方向,只有具备多模态理解与执行能力,AI才能进入物理世界实现具身。
- 记忆与持续学习:构建从个体记忆到人类整体的“第四级记忆系统”是未来基础设施。
- 知识压缩:能否找到将知识压缩到更小空间的新方法,是突破效率瓶颈的关键。
唐杰展望,2026年AI for Science可能迎来爆发年,同时模型架构创新将解决超长上下文和高效知识压缩问题。他判断,“已知的是我们不断加数据、探索上限;未知的是新范式是什么”,但2026年很可能出现显著范式转变。
杨植麟:Scaling Law本质是把能源转化为智能,Token效率与长上下文成下一代关键
月之暗面创始人兼CEO杨植麟从第一性原理出发,认为自2019年以来大模型始终遵循Scaling Law——“把能源转化成智能”。在数据和算力受限的背景下,如何用更少投入获取更高智能成为核心命题。他展示了Kimi K2模型在训练中平稳下降的损失值曲线,称其为“2025年最漂亮的曲线”,并强调“当你有一个优雅的方法,就可以得到一个优雅的结果”。具体技术突破包括:
- Token效率:团队提出改进的Muon优化器Moonlight Muon,实现约2倍Token效率提升,并通过QK-Clip解决Logits爆炸问题,支撑万亿参数稳定训练。
- 长上下文:Kimi-Linear配合全新线性注意力机制,在保证效果的同时大幅提升推理速度,为超长Context任务(Agent时代的基础能力)提供现实路径。
- 模型“品味”:智能是Non-Fungible Token,承载着品味、审美与价值观。下一代模型K3的目标即新架构、更大规模合成数据以及品味提升。
杨植麟同时强调,所有重大技术突破都伴随风险,“但不能因恐惧而停滞不前”。
林俊旸:从语言模型到Generalist Agent,模型即产品
阿里千问大模型技术负责人林俊旸在演讲中调整了PPT标题——从“Towards a Generalist Model”改为“Generalist Agent”。他认为Agent是一个比模型本身更大的概念,AI应像人一样自主使用工具、在环境中完成任务。他提出两大战略方向:
- 构建Omni模型:具备视觉输出与推理能力的多模态模型,能同时接收和生成文本、图像、语音等模态。
- 从训练模型转向训练Agent:通过多轮强化学习和环境反馈,实现长时任务推理(long-horizon reasoning),进而走向Digital Agent(GUI操作、API调用),最终迈向物理世界机器人。
针对争议话题,林俊旸评价“Manus确实很成功,但套壳是不是未来,这本身也是个话题”。他更认同“模型即产品”的方向——未来Agent不应只是外部应用,而是模型本身直接承担产品能力,研究人员需像产品经理一样把成果做成真实可用的系统。他预测Memory技术还需约一年达到人类可感的“临界点”,而主动学习的Agent将具备长时间托管式工作能力,在执行通用任务中自行进化。
圆桌交锋:模型分化与Agent前景激辩,中国领先概率被估20%
圆桌论坛上,唐杰、林俊旸、姚顺雨与港科大荣休教授杨强碰撞出激烈观点,聚焦四大议题:
- 模型分化:姚顺雨观察到To-C与To-B明显分化——To-C场景下智能上限需求不高,更多是“增强版搜索引擎”;To-B则智能直接等于生产力。林俊旸认为分化是自然发生,中美在Coding Token消耗量上存在巨大差距。唐杰直言“DeepSeek之后,Chat领域的竞争基本结束”,智谱决定押注编程。
- 自主学习:姚顺雨认为ASI最重要的能力是自主学习,目前瓶颈不在方法论而在任务设计。ChatGPT和Claude Code已通过用户数据或自生成代码实现自主学习,只是受限于场景渐变发展。
- Agent环境部署:姚顺雨指出To B生产力型Agent仍处早期,即使模型停止进化,仅靠大规模落地部署也能带来10–100倍效率提升。林俊旸认为Agent发展是产品哲学问题,通用Agent的核心价值在于解决海量长尾需求。唐杰强调Agent成功取决于价值、成本、速度三点,需在半年内拉开时间窗口。
- 中国AI领先概率:林俊旸相对谨慎,认为未来3-5年内中国团队全球领先的概率约20%,且已是非常乐观的估计——美国算力多1-2个数量级,国内算力多用于交付而非前沿探索。但他认为“穷则生变”,软硬协同可能孕育新机会。姚顺雨持乐观态度,认为中国工程能力和人才密度优势明显,但需突破产能瓶颈并培养敢于前沿探索的冒险文化。唐杰指出90后、00后更具创新精神,若营商环境改善、长期坚持,中国AI创新仍有现实机会。
张钹院士:AGI必须可检验,大模型存在五大根本缺失
91岁的清华大学教授、中国人工智能研究先行者张钹院士临场准备PPT,回应从语言模型到AGI的核心问题。他指出,当前大模型基于近似语义定义,将词语周围频率最高的词映射为向量空间的几何结构,由此不可避免带来五类缺失:指称缺失、因果缺失、语用缺失、多义与动态语境缺失、闭环行为缺失。这些缺失直接影响模型应用能力。
针对AGI定义混乱,张钹主张抛弃模糊、不可执行的说法(如马斯克的“人类70%以上任务机器都会干且达到或超过人类水平”),建立“可执行、可检验”的标准。他提出AGI应具备五大核心能力:时空一致的多模态理解与落地、可控的在线学习与适应、可验证的推理与长期执行与规划、可校准的反思与元认知、跨任务的强泛化。他强调,“按照这个定义,应该可以指导我们往前做”。
最后,张钹提醒真正需要治理的不是AI本身,而是研究者和使用者。他改变了过去不鼓励学生创业的态度,认为大模型改变了一切,“最优秀的学生应该去搞企业”。