清华00后校友王冠再出新作:用1/900 token、1/432算力,颠覆Transformer预训练模型

00后清华校友再出手:向Transformer开战

这位曾拒绝马斯克邀约的清华00后校友王冠,正带领团队Sapient Intelligence挑战AI领域最核心的基石——Transformer架构。他直言“当前大模型更像是在背题”,认为模型用系统1处理系统2的问题,卡在了“系统1.5”的梦境状态。最新成果分层推理模型HRM(Hierarchical Reasoning Model)正式公布,被认为是对传统预训练模式的根本性颠覆。

分层推理模型HRM:类脑AI的破局之道

HRM的核心是模仿人脑的分层推理机制。传统Transformer依赖大量token和算力进行全局注意力计算,而HRM通过分层结构让模型仅需激活必要部分即可完成推理。技术细节显示,该模型使用“mask_modules”等配置,在27M参数的小模型上实现了类似大脑“选择性激活”的机制。王冠团队认为,这种架构让模型从“死记硬背”转向真正的推理。

仅凭1000个样本、无需预训练:震惊业界的超低训练成本

HRM最大的突破在于训练效率。团队仅使用1000个训练样本、无需任何预训练、无需CoT(思维链)数据,就完成了模型训练。对比传统Transformer需要数万亿token的预训练数据和数千张GPU,HRM只需1/900的token量和1/432的算力。这一数据直接来自实验结果,意味着普通开发者单张显卡即可复现这一成果。

开源地址公布:GitHub上1.2万行代码全透明

Sapient Intelligence已完全开源HRM模型,包括config.json、pytorch_model.bin及onnx/tokenizer.json等全套文件。GitHub仓库中,用户可以直接查看模型的分层掩码配置(如[[false, false], [true, false]...]),以及词汇表等细节。开源意味着全球开发者可以验证并改进这一架构,加速AI推理范式的演进。

重新定义大模型发展方向:从“背题”到“推理”

王冠团队的目标是让大模型摆脱“背题模式”,实现类脑的深度推理。HRM不仅算力需求极低,且可复现性强,为中小团队甚至个人研究者提供了挑战巨头的可能性。业内分析认为,如果HRM被验证可扩展到更大规模,Transformer的统治地位将面临真正威胁。