2700GB高质量数据训练出空间智能SOTA,背后全栈开源策略功不可没。
蚂蚁灵波开源包含2.71T数据和300万对样本的LingBot-Depth空间感知数据集及模型。
微软、剑桥与普林斯顿大学联合推出的MicroCoder项目,通过在算法、数据、框架及训练经验四个维度的全面升级,解决了现有代码大模型训练中因数据过于简单及旧有训练范式失效而导致的瓶颈问题。