清华00后校友王冠带领Sapient Intelligence团队发布分层推理模型HRM,仅用1/900 token和1/432算力即可完成与Transformer同等效果的训练,颠覆了传统预训练范式。