对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课

1 个月前

AI资讯

60 阅读

大模型面壁智能端侧AI 国产芯

端侧模型不是跟云端竞争，而是要当好“本科毕业生”

李大海在采访中反复强调，端侧模型的目标并非取代云端大模型，而是与其协同。他形象地比喻：云端模型要培养成“全科博士”，无所不能；而端侧模型只需达到“大学本科毕业生”水平，能机敏地在终端环境里执行指令——比如刷盘子、洗碗、提供情绪价值。“只要成为一个本科生，它就能去刷盘子，洗碗，带孩子，给你提供情绪价值，足够了。”李大海说。当用户有更高需求时，端侧模型可以随时调用云端能力。

基于“知识密度”这一核心概念，面壁智能发现大模型的知识密度平均每8个月提升一倍。2023年20亿参数的模型就能达到1750亿参数GPT-3的效果。他们计划在2026年底之前发布一个10~20B参数的端侧模型，使其智能水平对齐GPT-4。这个模型将能够运行在手机、PC、汽车和机器人终端，成为“感知、决策、行为”三位一体的核心。

国产芯片软件要补课：英伟达也是走了20年

李大海坦承，端侧模型在国产芯片上落地的最大障碍并非硬件性能，而是软件生态的成熟度。他以英伟达为例：“英伟达经过了20年软件方面的建设，现在软件生态非常丰富，但他们为端侧芯片、大模型做工作，这件事近两年才开始。”当前国产芯片厂商的软件栈在支持端侧模型时，还存在大量集成和优化工作要做。“端侧模型在芯片的落地，其实需要我们跟芯片厂商一起去做很多工作，有些工作其实不是在优化我们的模型，是在优化它的。”

对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课

他同时指出，这种“补课”正是创业公司的机会——与芯片厂商深度协同，帮助其加速软件生态建设。面壁智能已经与多家芯片和终端厂商展开合作，例如为梧桐汽车提供芯算一体AI座舱方案，与长城汽车共同推进端侧大模型在车载场景的应用。

端侧AI的落地场景：汽车、机器人、PC与手机的“三位一体”

李大海认为，当前端侧模型最具确定性的落地场景是智能汽车、机器人、PC和手机。汽车被其视为“超级终端智能体”，因为网络不稳定、隐私要求高、实时性要求强，端侧方案天然适配。面壁智能在今年3月发布的纯端侧模型驱动的“面壁小钢炮超级助手”已首先在汽车上落地，实现舱内外视觉、语音的全模态感知与决策。

机器人是下一个皇冠上的明珠。面壁智能已与一家情感陪伴机器人公司合作，将端侧模型嵌入仿生机器猫，使其在断网环境下仍能与用户深度交流、提供情绪价值。李大海强调，未来物理世界实现AGI“一定是通过端侧智能”——只有把大脑部署在终端上，设备才能做到最灵敏的感知、最及时的决策。

对于手机和PC，李大海指出，苹果Apple Intelligence已经做了示范，“照抄作业就够了”，但国内厂商一定会在模型能力上做得更好。“中国厂商的落地能力很强，而且在模型能力上来讲，我们一定比苹果好。”他举例，面壁8B参数的多模态模型MiniCPM-Llama3-V 2.5已达到甚至超过GPT-4V的多模态性能，且能在iPad上流畅运行。

大模型创业的耐心与信念：AGI是7-10年的马拉松

谈及AGI信念，李大海态度坚定：“Never，从来没有动摇过。”他在加入面壁之前曾逐一询问核心成员：“你们相不相信AGI？面壁智能是不是要做AGI？”得到所有人的肯定答复后，他才决定all in。他坦言，自己对AGI的预期是7到10年，“我们没有觉得这个事情是下一年，下一刻。”

但他同时强调，商业闭环不能等那么久。“任何一个业务最终都应该是商业效率的比拼，大语言模型也没有离开这个规律……大家的耐心是有限的。”端侧模型之所以更具现实性，是因为它离用户最近，能够在汽车、机器人等场景率先产生确定性价值。他建议创业者不要抱太高期待：“基于大模型去找新的C端场景，至少需要两年。”而创业公司的机会在于追求“非共识”——像竹子一样，前三年在地下扎根，一旦冒头，别人很难快速复制。

斯坦福抄袭事件印证：中国端侧模型已全球领先

2024年5月，斯坦福大学学生团队抄袭面壁智能的MiniCPM-Llama3-V 2.5模型，引发全球关注。李大海对此坦言“挺惶恐”，但认为这恰恰证明了中国在端侧模型领域的领先地位。“当一个其他团队愿意拿你的模型来套壳说是自己的时候，我觉得这是一种非常强的说服力，说明我们的模型确实是有可取之处。”

在最大、最聪明的云端模型层面，李大海承认中国与美国仍有较大差距，但在端侧模型和开源模型方面，“中国很多领域有自己的创新和探索，在全球范围内都算是比较领先的”。他呼吁产业链正视现实：国产芯片的软件生态需要加速补课，但端侧智能的浪潮才刚刚开始，“每个立志于做好AI的创业者，在这幅像千里江山图一样徐徐展开的画卷里，都可以找到自己的方向。”

对话面壁CEO李大海：端侧AI模型赶上GPT-4，国产芯软件要补课

端侧模型不是跟云端竞争，而是要当好“本科毕业生”

国产芯片软件要补课：英伟达也是走了20年

端侧AI的落地场景：汽车、机器人、PC与手机的“三位一体”

大模型创业的耐心与信念：AGI是7-10年的马拉松

斯坦福抄袭事件印证：中国端侧模型已全球领先

链接失效反馈