首页

登录

杨植麟最新演讲：2027年AI将主导研究

7 天前

AI资讯

26 阅读

Agent [AI 规模化长上下文]

规模化效率革命：Token、长上下文与Agent集群三箭齐发

杨植麟强调，大模型的本质是“将能源转化为智能”，但规模化绝非暴力堆砌算力。Kimi围绕三大方向构建规模化策略：

Token效率：有效数据是有限常量，通过更优网络架构与优化器，从等量数据中提取更多智能。
长上下文：自研Kimi Linear架构，让模型在更长输入下获得更低损失函数，支撑复杂任务执行。
Agent集群：K2.5旗舰模型首创Agent Swarm技术，打破单一智能体效率瓶颈，实现多智能体协同工作。

注意力残差开源：打破十年技术定式，仅花2%成本换性能飞跃

此前3月16日，Kimi推出注意力残差（Attention Residuals）并全面开源。该技术以残差网络为基础，将注意力机制从时间维度“旋转”至深度维度，整合模型所有层级输出优化训练。

仅增加2%额外成本，性能实现大幅跃升。
杨植麟指出：“许多过去被视为标准的技术，现在都是可以被挑战的。”研究已从偏学术的“idea驱动”转向工程与实证结合的模式。

Kimi开源生态成产业新基准：英伟达、芯片厂商、研究机构全面接入

目前Kimi开源生态已上升为全球AI产业新标准：

英伟达GTC 2026：Kimi模型被用作芯片性能评测基准。
芯片厂商：发布新品需通过Kimi验证性能提升。
研究机构：大量前沿课题基于K2.5开展。杨植麟认为，开源降低了获取智能的门槛，推动形成共生生态。

大模型训练三阶段：从人工标注到AI自动合成任务

杨植麟系统梳理了大模型训练的演进路径：

三年前：依赖互联网天然数据+少量人工标注，判断内容是否符合价值观。
2025年：大规模强化学习系统崛起，人工筛选高质量任务（如编程、数学），模型通过强化学习提升效果。
未来一两年：AI将主导研究，每个研究员配备海量Token，AI自动合成新任务、构建新环境、定义最优奖励函数，甚至自主探索全新网络架构。整个研发速度将进一步加快。