清华系团队做分布式预测世界模型、获数亿元A轮融资，落地终端设备达十万量级｜硬氪首发

1 个月前

AI资讯

44 阅读

端侧大模型 A轮融资分布式预测清华系

00后博士带队，把300亿参数大模型塞进电脑

当行业普遍认为端侧只能跑小模型时，清华00后博士王冠博带领的万格智元团队，用自研的cPilot端侧算力引擎给出了颠覆性答案。他们不依赖昂贵的GPU，而是通过自研的非GPU推理引擎，在消费级硬件上实现了300亿参数模型仅4GB内存开销、推理速度达30 tokens/s的成绩。这意味着用户手中的普通电脑，就能直接对标云端GPT-4o级别的性能，让“终端版贾维斯”成为可能。

王冠博在采访中强调：“不是为了跑在端上而刻意用一个小模型，而是要把真正的大模型直接放到端上来运行。”团队从底层算子优化和流式并行调度入手，将模型推理协同拆分，让“放不下”的大模型放得下，让“放得下”的大模型算得快。这一突破直接打破了“端侧只能阉割性能”的旧认知。

端侧推理引擎打破“小模型”魔咒

万格智元的核心逻辑是：算力不应继续堆在云端，而应被重新分配到每个人手边的终端。原因有三：端侧成本封顶（硬件一次性投入后边际推理成本趋近于零）、响应时间封顶（无需等待云端回传）、隐私天然保障（数据不出设备）。公司创始人王冠博指出，未来agent的token消耗将是百倍、千倍增长，按token付费的模式无解，唯有端侧推理才能从根本上解决算力负载问题。

清华系团队做分布式预测世界模型、获数亿元A轮融资，落地终端设备达十万量级｜硬氪首发

目前，万格智元已落地AI PC和机器人两大场景，并自研了纯本地的个人助理产品，可类比“本地的Claude Code和Manus”。团队由认识七年的同学组成，粘合度极高，已完成数千万元种子轮融资，正推动“端侧普惠算力”路线加速落地。

融资加码，清华系端侧AI军团加速商业化

几乎同时，另一支清华系团队面壁智能宣布完成新一轮数亿元融资，由龙芯创投、鼎晖百孚、中关村科学城基金等联合领投。面壁智能联合创始人、CEO李大海在全员信中表示：“大模型正在进入真刀真枪的比拼阶段，从大跃进转向持久战。”公司凭借端侧模型“面壁小钢炮”MiniCPM系列，自今年2月发布以来累计下载量超300万次，屡次登顶GitHub、HuggingFace趋势榜单。

商业化方面，面壁智能已与华为、联发科技、联想、英特尔、长城汽车、易来科技等企业合作，覆盖AI Phone、AIPC、智能座舱、智能家居与具身机器人等领域。其端侧模型已落地超十万台终端设备，并与深圳中院合作启用全国首个司法审判垂直领域大模型，法信法律基座大模型更被定位为国家级法律AI基础设施。

从云端到本地：算力普惠的“水电气”革命

两家清华系公司的共同愿景，是让大模型算力像水、电一样自然流动。万格智元要做AI时代的“算力供水商”，把算力带回终端，让每个人、每台设备都能获得可持续、低成本、强隐私的智能。面壁智能则提出“大模型面壁定律”“密度定律”，以知识密度（模型能力/参与计算的参数）指导技术迭代，实现“同等参数、更高性能、更低能耗”。

李大海在全员信中强调：“所有的领先，往深处都是认知的领先；任何商业竞争，归根结底都是效率的比拼。”当端侧推理引擎让300亿参数模型在本地流畅运行，当MiniCPM系列被集成进手机、汽车、机器人，AI正从少数人按次消费的工具，变成人人可用的本地能力。这场由清华系团队引领的端侧算力革命，正在重新定义AI基础设施的底层逻辑。

清华系团队做分布式预测世界模型、获数亿元A轮融资，落地终端设备达十万量级｜硬氪首发

00后博士带队，把300亿参数大模型塞进电脑

端侧推理引擎打破“小模型”魔咒

融资加码，清华系端侧AI军团加速商业化

从云端到本地：算力普惠的“水电气”革命

链接失效反馈