清华00后校友王冠再出新作：用1/900 token、1/432算力，颠覆Transformer预训练模型

1 个月前

AI资讯

46 阅读

人工智能清华校友王冠分层推理模型HRM

00后清华校友再出手：向Transformer开战

这位曾拒绝马斯克邀约的清华00后校友王冠，正带领团队Sapient Intelligence挑战AI领域最核心的基石——Transformer架构。他直言“当前大模型更像是在背题”，认为模型用系统1处理系统2的问题，卡在了“系统1.5”的梦境状态。最新成果分层推理模型HRM（Hierarchical Reasoning Model）正式公布，被认为是对传统预训练模式的根本性颠覆。

分层推理模型HRM：类脑AI的破局之道

HRM的核心是模仿人脑的分层推理机制。传统Transformer依赖大量token和算力进行全局注意力计算，而HRM通过分层结构让模型仅需激活必要部分即可完成推理。技术细节显示，该模型使用“mask_modules”等配置，在27M参数的小模型上实现了类似大脑“选择性激活”的机制。王冠团队认为，这种架构让模型从“死记硬背”转向真正的推理。

仅凭1000个样本、无需预训练：震惊业界的超低训练成本

HRM最大的突破在于训练效率。团队仅使用1000个训练样本、无需任何预训练、无需CoT（思维链）数据，就完成了模型训练。对比传统Transformer需要数万亿token的预训练数据和数千张GPU，HRM只需1/900的token量和1/432的算力。这一数据直接来自实验结果，意味着普通开发者单张显卡即可复现这一成果。

开源地址公布：GitHub上1.2万行代码全透明

Sapient Intelligence已完全开源HRM模型，包括config.json、pytorch_model.bin及onnx/tokenizer.json等全套文件。GitHub仓库中，用户可以直接查看模型的分层掩码配置（如[[false, false], [true, false]...]），以及词汇表等细节。开源意味着全球开发者可以验证并改进这一架构，加速AI推理范式的演进。

重新定义大模型发展方向：从“背题”到“推理”

王冠团队的目标是让大模型摆脱“背题模式”，实现类脑的深度推理。HRM不仅算力需求极低，且可复现性强，为中小团队甚至个人研究者提供了挑战巨头的可能性。业内分析认为，如果HRM被验证可扩展到更大规模，Transformer的统治地位将面临真正威胁。