首页
登录
当前标签:推理速度]
小米雷军:MiMo 昨晚发布 V2.5-Pro-UltraSpeed,这是业内首次在 1 万亿参数模型上突破 1000 tokens/s 输出速度
第一款万亿参数模型推理速度突破1000 tokens/s,且无需定制芯片,仅凭通用GPU全链路优化达成。