清华系团队做分布式预测世界模型、获数亿元A轮融资,落地终端设备达十万量级|硬氪首发

00后博士带队,把300亿参数大模型塞进电脑

当行业普遍认为端侧只能跑小模型时,清华00后博士王冠博带领的万格智元团队,用自研的cPilot端侧算力引擎给出了颠覆性答案。他们不依赖昂贵的GPU,而是通过自研的非GPU推理引擎,在消费级硬件上实现了300亿参数模型仅4GB内存开销、推理速度达30 tokens/s的成绩。这意味着用户手中的普通电脑,就能直接对标云端GPT-4o级别的性能,让“终端版贾维斯”成为可能。

王冠博在采访中强调:“不是为了跑在端上而刻意用一个小模型,而是要把真正的大模型直接放到端上来运行。”团队从底层算子优化和流式并行调度入手,将模型推理协同拆分,让“放不下”的大模型放得下,让“放得下”的大模型算得快。这一突破直接打破了“端侧只能阉割性能”的旧认知。

端侧推理引擎打破“小模型”魔咒

万格智元的核心逻辑是:算力不应继续堆在云端,而应被重新分配到每个人手边的终端。原因有三:端侧成本封顶(硬件一次性投入后边际推理成本趋近于零)、响应时间封顶(无需等待云端回传)、隐私天然保障(数据不出设备)。公司创始人王冠博指出,未来agent的token消耗将是百倍、千倍增长,按token付费的模式无解,唯有端侧推理才能从根本上解决算力负载问题。

清华系团队做分布式预测世界模型、获数亿元A轮融资,落地终端设备达十万量级|硬氪首发

目前,万格智元已落地AI PC和机器人两大场景,并自研了纯本地的个人助理产品,可类比“本地的Claude Code和Manus”。团队由认识七年的同学组成,粘合度极高,已完成数千万元种子轮融资,正推动“端侧普惠算力”路线加速落地。

融资加码,清华系端侧AI军团加速商业化

几乎同时,另一支清华系团队面壁智能宣布完成新一轮数亿元融资,由龙芯创投、鼎晖百孚、中关村科学城基金等联合领投。面壁智能联合创始人、CEO李大海在全员信中表示:“大模型正在进入真刀真枪的比拼阶段,从大跃进转向持久战。”公司凭借端侧模型“面壁小钢炮”MiniCPM系列,自今年2月发布以来累计下载量超300万次,屡次登顶GitHub、HuggingFace趋势榜单。

商业化方面,面壁智能已与华为、联发科技、联想、英特尔、长城汽车、易来科技等企业合作,覆盖AI Phone、AIPC、智能座舱、智能家居与具身机器人等领域。其端侧模型已落地超十万台终端设备,并与深圳中院合作启用全国首个司法审判垂直领域大模型,法信法律基座大模型更被定位为国家级法律AI基础设施。

从云端到本地:算力普惠的“水电气”革命

两家清华系公司的共同愿景,是让大模型算力像水、电一样自然流动。万格智元要做AI时代的“算力供水商”,把算力带回终端,让每个人、每台设备都能获得可持续、低成本、强隐私的智能。面壁智能则提出“大模型面壁定律”“密度定律”,以知识密度(模型能力/参与计算的参数)指导技术迭代,实现“同等参数、更高性能、更低能耗”。

李大海在全员信中强调:“所有的领先,往深处都是认知的领先;任何商业竞争,归根结底都是效率的比拼。”当端侧推理引擎让300亿参数模型在本地流畅运行,当MiniCPM系列被集成进手机、汽车、机器人,AI正从少数人按次消费的工具,变成人人可用的本地能力。这场由清华系团队引领的端侧算力革命,正在重新定义AI基础设施的底层逻辑。