余承东开始反思盘古大模型了

全球最早入局者,为何“起了大早赶了晚集”?

在2026年华为开发者大会上,余承东直言自己是“第一个做大模型的人”,盘古大模型早在2021年4月便正式发布,彼时全世界仍对大模型概念知之甚少。然而,由于后续种种原因,这位先行者未能保持领先优势。余承东坦言:“后来因为各种原因没做好。”这一反思揭示了华为在大模型初期的战略节奏与现实脱节的困境——尽管起步最早,但在算力资源分配、团队聚焦度以及商业化路径上出现了偏差,导致被后来者反超。

余承东开始反思盘古大模型了

余承东重掌帅印:字典里没有第二,只有第一

去年国庆节前夕,余承东再度被委任负责盘古大模型。他在演讲中放出豪言:“去年我重新负责,团队将会一路赶超,在我余生的字典里,没有第二,只有第一,我们会从中国第一走向世界第一。”这一表态不仅是对团队的重振旗鼓,更是一次深刻的自我审视。余承东将反思转化为行动,明确表示要聚焦时延和吞吐率的提升,并解释华为之所以未堆砌更大参数(开源盘古2.0总参数505B),是因为算力大量支持国内其他企业需求,留给自身的资源有限。这种“以生态优先”的取舍背后,折射出华为对产业链协同的深层考量。

开源盘古2.0重磅出击:505B参数与鸿蒙生态深度融合

本次大会推出的开源盘古openPangu 2.0成为最大亮点。该模型分为Pro与Flash两大版本:Pro版总参数量达505B,激活参数量18B;Flash版总参数量92B,激活参数量6B。同时支持512K超长上下文窗口,深度优化适配昇腾算力,单卡吞吐率达业内主流开源模型的2倍。更关键的是,它与鸿蒙生态深度融合,在运行智能体任务时具备速度更快、精度更高、资源消耗更低的优势。余承东还透露,该模型将于6月30日起陆续开放7大核心组件,新增预训练代码、后训练代码、训练算子等开源内容,试图通过开放生态吸引更多开发者。

数据合成与算力优化:华为盘古的破局之道

除了模型本身,余承东强调了数据合成技术的战略地位。盘古大模型依托weak2strong数据合成技术,强化长序列、复杂推理等高阶数据分布,把数据质量作为构建核心竞争力的关键抓手。面对算力成本高昂的现状,华为选择更聚焦于实际应用场景中的性能优化,而非盲目扩大参数规模。余承东解释称:“AI算力成本非常高,华为更聚焦时延和吞吐率的提升。”这一务实路线,既是对前期“拉踩”风波的冷静回应,也预示着盘古大模型将回归效率与落地并重的研发逻辑。