杨植麟/张鹏/夏立雪/罗福莉/黄超,谈龙虾,谈“Token经济学”
Agent的技术突破与范式转变
在月之暗面创始人杨植麟的主持下,智谱华章CEO张鹏、无问芯穹CEO夏立雪、小米MiMo负责人罗福莉及港大教授黄超齐聚一堂,共同剖析了当前AI领域的热点。讨论首先聚焦于OpenClaw(此处指代文中提到的Agent产品)引发的技术变革。
- 交互与体验的革新:黄超指出,OpenClaw带来了“活人感”的交互体验,相比传统的工具感,它更接近理想的个人助手(Jarvis)。这种以软件切入的IM式交互,降低了用户使用顶尖模型的门槛。
- 任务完成能力的飞跃:张鹏将其比喻为“脚手架”,使得非程序员也能通过自然语言完成编程等复杂任务,实现了从“对话”到“干活”的转变。夏立雪也提到,虽然初期上手可能觉得慢,但它能处理大型任务,极大地拓展了AI的想象力空间。
- 开源与生态的催化:罗福莉高度评价其开源属性,认为这极大地促进了社区参与。OpenClaw通过Harness和Skills系统,将国产模型的上限拉升至接近顶级闭源模型的水平,同时保障了任务完成的下限,点燃了模型之外那一层(Agent层)的创新热情。
从“聊天”到“干活”:Token消耗与商业模式重构
随着Agent执行复杂任务,算力消耗呈现指数级增长,这直接导致了市场策略的调整。

- 任务驱动的成本激增:张鹏解释了智谱GLM Turbo模型提价的逻辑。他指出,完成一个复杂任务所需的Token量,可能是简单问答的十倍甚至百倍,因为这中间包含了大量的规划、试错和Debug过程。
- 回归商业价值:长期的低价竞争不利于行业发展。提价是为了回归正常的商业逻辑,确保厂商能持续投入资源优化模型,提供更高质量的服务。这标志着行业正从以聊天量级计费,转向以任务完成度计费。
推理时代的算力基础设施与系统挑战
进入推理时代,Token用量的爆发式增长对底层基础设施提出了前所未有的挑战。
- 需求的爆发与基建滞后:夏立雪透露,其公司的Token用量每两周翻一番,累计增长已达十倍。然而,现有的云计算基础设施(如K8s)是为人类(分钟级操作)设计的,无法满足Agent毫秒级思考和发起任务的需求。
- 打造Agent原生的基础设施:夏立雪认为,需要构建“Agentic Infra”,即智慧化的算力投放工厂。更长远来看,基础设施本身也应成为智能体,实现自我进化与迭代。
- 算力成为核心卡点:张鹏对此前国产芯片受限环境下催生的结构创新(如DeepSeek的MoE架构)予以肯定,但同时也直指未来一年最大的挑战就是“算力”。随着推理需求可能增长百倍,算力短缺将成为最大制约。
技术痛点与未来突破方向
针对Agent的进一步发展,与会专家指出了当前的技术瓶颈,并展望了值得关注的方向。
- Planning与Memory的局限:黄超指出,面对超长链路任务,模型在规划(Planning)方面缺乏足够的隐性知识;而记忆(Memory)系统则面临信息压缩失真和检索效率低下的问题,现有的文件系统式存储难以通用。
- Skill质量与安全风险:在Tool Use方面,现有的Skill生态存在严重的质量参差不齐和恶意注入风险,急需社区共同建立高质量的Skill库。
- 长上下文与自进化:罗福莉强调,Agent越用越聪明的前提是超长上下文。如果能在百万甚至千万级Context下实现低成本、高速度的推理,模型就能通过长程任务实现“自进化”,从而具备科研探索能力,大幅提升生产力。
展望:生态、自进化、可持续与算力
在对未来的展望中,四位嘉宾分别用一个关键词概括了未来一年的关键趋势:
- 生态(黄超):未来的软件将从面向人类(GUI)转向面向Agent原生(CLI)。Agent将从“个人助手”转变为真正的“打工人(Coworker)”,这需要整个生态的开源共建。
- 自进化(罗福莉):大模型结合强大的Agent框架,将在科研等领域实现指数级加速。模型能够在可验证的约束下自主迭代,探索世界上原本不存在的知识。
- 可持续Token(夏立雪):中国有机会凭借能源和制造优势,将算力转化为优质Token并输出全球,打造“世界的Token工厂”,建立具有中国特色的Token经济学,形成从能源到GDP的可持续链路。
- 算力(张鹏):仰望星空之后需脚踏实地,算力依然是未来十二个月最关键、最现实的问题。