对话面壁CEO李大海:端侧AI模型赶上GPT-4,国产芯软件要补课

端侧模型不是跟云端竞争,而是要当好“本科毕业生”

李大海在采访中反复强调,端侧模型的目标并非取代云端大模型,而是与其协同。他形象地比喻:云端模型要培养成“全科博士”,无所不能;而端侧模型只需达到“大学本科毕业生”水平,能机敏地在终端环境里执行指令——比如刷盘子、洗碗、提供情绪价值。“只要成为一个本科生,它就能去刷盘子,洗碗,带孩子,给你提供情绪价值,足够了。”李大海说。当用户有更高需求时,端侧模型可以随时调用云端能力。

基于“知识密度”这一核心概念,面壁智能发现大模型的知识密度平均每8个月提升一倍。2023年20亿参数的模型就能达到1750亿参数GPT-3的效果。他们计划在2026年底之前发布一个10~20B参数的端侧模型,使其智能水平对齐GPT-4。这个模型将能够运行在手机、PC、汽车和机器人终端,成为“感知、决策、行为”三位一体的核心。

国产芯片软件要补课:英伟达也是走了20年

李大海坦承,端侧模型在国产芯片上落地的最大障碍并非硬件性能,而是软件生态的成熟度。他以英伟达为例:“英伟达经过了20年软件方面的建设,现在软件生态非常丰富,但他们为端侧芯片、大模型做工作,这件事近两年才开始。”当前国产芯片厂商的软件栈在支持端侧模型时,还存在大量集成和优化工作要做。“端侧模型在芯片的落地,其实需要我们跟芯片厂商一起去做很多工作,有些工作其实不是在优化我们的模型,是在优化它的。”

对话面壁CEO李大海:端侧AI模型赶上GPT-4,国产芯软件要补课

他同时指出,这种“补课”正是创业公司的机会——与芯片厂商深度协同,帮助其加速软件生态建设。面壁智能已经与多家芯片和终端厂商展开合作,例如为梧桐汽车提供芯算一体AI座舱方案,与长城汽车共同推进端侧大模型在车载场景的应用。

端侧AI的落地场景:汽车、机器人、PC与手机的“三位一体”

李大海认为,当前端侧模型最具确定性的落地场景是智能汽车、机器人、PC和手机。汽车被其视为“超级终端智能体”,因为网络不稳定、隐私要求高、实时性要求强,端侧方案天然适配。面壁智能在今年3月发布的纯端侧模型驱动的“面壁小钢炮超级助手”已首先在汽车上落地,实现舱内外视觉、语音的全模态感知与决策。

机器人是下一个皇冠上的明珠。面壁智能已与一家情感陪伴机器人公司合作,将端侧模型嵌入仿生机器猫,使其在断网环境下仍能与用户深度交流、提供情绪价值。李大海强调,未来物理世界实现AGI“一定是通过端侧智能”——只有把大脑部署在终端上,设备才能做到最灵敏的感知、最及时的决策。

对于手机和PC,李大海指出,苹果Apple Intelligence已经做了示范,“照抄作业就够了”,但国内厂商一定会在模型能力上做得更好。“中国厂商的落地能力很强,而且在模型能力上来讲,我们一定比苹果好。”他举例,面壁8B参数的多模态模型MiniCPM-Llama3-V 2.5已达到甚至超过GPT-4V的多模态性能,且能在iPad上流畅运行。

大模型创业的耐心与信念:AGI是7-10年的马拉松

谈及AGI信念,李大海态度坚定:“Never,从来没有动摇过。”他在加入面壁之前曾逐一询问核心成员:“你们相不相信AGI?面壁智能是不是要做AGI?”得到所有人的肯定答复后,他才决定all in。他坦言,自己对AGI的预期是7到10年,“我们没有觉得这个事情是下一年,下一刻。”

但他同时强调,商业闭环不能等那么久。“任何一个业务最终都应该是商业效率的比拼,大语言模型也没有离开这个规律……大家的耐心是有限的。”端侧模型之所以更具现实性,是因为它离用户最近,能够在汽车、机器人等场景率先产生确定性价值。他建议创业者不要抱太高期待:“基于大模型去找新的C端场景,至少需要两年。”而创业公司的机会在于追求“非共识”——像竹子一样,前三年在地下扎根,一旦冒头,别人很难快速复制。

斯坦福抄袭事件印证:中国端侧模型已全球领先

2024年5月,斯坦福大学学生团队抄袭面壁智能的MiniCPM-Llama3-V 2.5模型,引发全球关注。李大海对此坦言“挺惶恐”,但认为这恰恰证明了中国在端侧模型领域的领先地位。“当一个其他团队愿意拿你的模型来套壳说是自己的时候,我觉得这是一种非常强的说服力,说明我们的模型确实是有可取之处。”

在最大、最聪明的云端模型层面,李大海承认中国与美国仍有较大差距,但在端侧模型和开源模型方面,“中国很多领域有自己的创新和探索,在全球范围内都算是比较领先的”。他呼吁产业链正视现实:国产芯片的软件生态需要加速补课,但端侧智能的浪潮才刚刚开始,“每个立志于做好AI的创业者,在这幅像千里江山图一样徐徐展开的画卷里,都可以找到自己的方向。”