面壁智能开源 MiniCPM5-1B：在 AA-Index 上超越所有 2B 参数以下模型，能跑在手机、浏览器上

1 个月前

AI资讯

65 阅读

开源 AI模型端侧小模型

小参数大威力：AA-Index榜单上的颠覆者

面壁智能联合清华大学自然语言处理实验室推出的MiniCPM5-1B，在AA-Index这一综合性评测榜单上，交出超越所有2B参数量以下模型的成绩单。这一结果延续了此前MiniCPM-2B的高歌猛进——后者曾在MTBench上超越Llama2-70B-Chat、Vicuna-33B等大参数量模型，如今5-1B再次以更小规模撬动更高性能，证明“小模型”在端侧场景的爆发力。

从CPU到手机：推理成本的核裂变

MiniCPM5-1B的核心突破在于“能跑在任意设备”。此前MiniCPM-2B在CPU上即可流畅运行，无需依赖昂贵的GPU，而新模型进一步将推理门槛拉低到手机芯片和浏览器环境。这意味着开发者不再需要云服务器或高端硬件：

手机端：模型压缩后体积可缩小75%，但仍然保持高性能，直接嵌入App实现离线智能
浏览器端：通过WebAssembly等优化，让网页直接运行轻量级大模型，无需下载额外运行时

这种“零部署成本”的端侧推理，彻底改变了传统大模型“先云端后终端”的昂贵模式。

参数数量不是唯一标尺：小模型如何越级挑战

MiniCPM5-1B的越级能力源于技术架构的精巧设计。面壁智能团队在极小参数量下，通过以下手段实现性能跃升：

高效训练与SFT：使用针对性微调（SFT）策略，使模型在公开综合性榜单上即超越同等规模标杆
稀疏激活与知识蒸馏：在减少冗余参数的同时，保留核心语义理解能力
端侧硬件适配：针对CPU、ARM芯片进行指令集优化，推理速度接近传统模型的数倍

最终，5-1B模型不仅在AA-Index上击败2B以下竞品，还在真实场景中支持文档摘要、对话生成等任务，与动辄数十B的模型相比毫不逊色。

多模态与极致轻量：面壁小钢炮的生态延伸

MiniCPM5-1B并非孤立存在。此前面壁智能已推出端侧多模态模型MiniCPM-V 2.6（8B参数），在单图、多图、视频理解三项任务上达SOTA，性能对标GPT-4V。5-1B的出现，进一步补全了“纯语言+多模态”的端侧矩阵：

语言模型：MiniCPM5-1B主打纯文本推理，适合轻量级对话、知识问答
多模态模型：MiniCPM-V系列处理图像、视频输入，两者协同覆盖智能终端全场景

面壁智能开源 MiniCPM5-1B：在 AA-Index 上超越所有 2B 参数以下模型，能跑在手机、浏览器上

小参数大威力：AA-Index榜单上的颠覆者

从CPU到手机：推理成本的核裂变

参数数量不是唯一标尺：小模型如何越级挑战

多模态与极致轻量：面壁小钢炮的生态延伸

链接失效反馈