余承东开始反思盘古大模型了

1 个月前

AI资讯

49 阅读

华为盘古大模型余承东反思

全球最早入局者，为何“起了大早赶了晚集”？

在2026年华为开发者大会上，余承东直言自己是“第一个做大模型的人”，盘古大模型早在2021年4月便正式发布，彼时全世界仍对大模型概念知之甚少。然而，由于后续种种原因，这位先行者未能保持领先优势。余承东坦言：“后来因为各种原因没做好。”这一反思揭示了华为在大模型初期的战略节奏与现实脱节的困境——尽管起步最早，但在算力资源分配、团队聚焦度以及商业化路径上出现了偏差，导致被后来者反超。

余承东开始反思盘古大模型了

余承东重掌帅印：字典里没有第二，只有第一

去年国庆节前夕，余承东再度被委任负责盘古大模型。他在演讲中放出豪言：“去年我重新负责，团队将会一路赶超，在我余生的字典里，没有第二，只有第一，我们会从中国第一走向世界第一。”这一表态不仅是对团队的重振旗鼓，更是一次深刻的自我审视。余承东将反思转化为行动，明确表示要聚焦时延和吞吐率的提升，并解释华为之所以未堆砌更大参数（开源盘古2.0总参数505B），是因为算力大量支持国内其他企业需求，留给自身的资源有限。这种“以生态优先”的取舍背后，折射出华为对产业链协同的深层考量。

开源盘古2.0重磅出击：505B参数与鸿蒙生态深度融合

本次大会推出的开源盘古openPangu 2.0成为最大亮点。该模型分为Pro与Flash两大版本：Pro版总参数量达505B，激活参数量18B；Flash版总参数量92B，激活参数量6B。同时支持512K超长上下文窗口，深度优化适配昇腾算力，单卡吞吐率达业内主流开源模型的2倍。更关键的是，它与鸿蒙生态深度融合，在运行智能体任务时具备速度更快、精度更高、资源消耗更低的优势。余承东还透露，该模型将于6月30日起陆续开放7大核心组件，新增预训练代码、后训练代码、训练算子等开源内容，试图通过开放生态吸引更多开发者。

数据合成与算力优化：华为盘古的破局之道

除了模型本身，余承东强调了数据合成技术的战略地位。盘古大模型依托weak2strong数据合成技术，强化长序列、复杂推理等高阶数据分布，把数据质量作为构建核心竞争力的关键抓手。面对算力成本高昂的现状，华为选择更聚焦于实际应用场景中的性能优化，而非盲目扩大参数规模。余承东解释称：“AI算力成本非常高，华为更聚焦时延和吞吐率的提升。”这一务实路线，既是对前期“拉踩”风波的冷静回应，也预示着盘古大模型将回归效率与落地并重的研发逻辑。

余承东开始反思盘古大模型了

全球最早入局者，为何“起了大早赶了晚集”？

余承东重掌帅印：字典里没有第二，只有第一

开源盘古2.0重磅出击：505B参数与鸿蒙生态深度融合

数据合成与算力优化：华为盘古的破局之道

链接失效反馈