AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队

推特博主集体震惊:从没听过的模型秒变开源SOTA

当Hugging Face社区出现名为“Rio 3.5”的模型时,多数人以为只是个普通的水文或市政项目。然而测试结果令人咋舌:该模型在智能体编程、数学、STEM、多语言和多模态基准上均达到开源领先水平,直接压过原来开源阵营的霸主Qwen 3.7。推特博主“Chubby”感叹:“一个以前从来没听过的模型现在成了开源SOTA,甚至超过了Qwen 3.7。”Hugging Face联合创始人兼CEO Clem Delangue随即发文:“AI的未来没有什么是注定的……路径一:闭源API,路径二:开源AI,包括里约市这样的机构。选你的路吧。”一时间,里约市政公司成为AI圈最意外的名字。

技术拆解:397B参数、百万级上下文,MIT许可证完全开放

Rio 3.5 Open 397B基于通义千问的Qwen 3.5-397B-A17B进行后训练,采用混合专家(MoE)架构:总参数397B,激活参数仅17B,大幅降低推理成本。最引人注目的是上下文窗口达到1,010,000 token,即百万级别,足以处理超长文档或代码库。许可证采用MIT,完全开源,可用于商业和研究,这意味着任何个人或企业都可直接部署甚至二次开发。开源地址已在Hugging Face上线(prefeitura-rio/Rio-3.5-Open-397B),基础模型Qwen 3.5的权重也为开源社区提供了“再训练”的起点。

AI圈懵了:一家巴西市政IT公司开源的大模型,杀进了全球第一梯队

SwiReasoning:免训练推理框架让效率和精度双赢

该模型性能提升的关键在于集成了一种名为SwiReasoning的免训练推理框架。该框架基于Shi等人2025年的研究论文(arXiv:2510.05069),可根据熵值实时判断何时进行显式思维链推理、何时进行潜空间推理。这样既保持了推理准确性,又大幅节省token消耗——尤其在复杂数学和编程任务中,效率提升显著。模型训练也特意针对潜空间推理的收益做了优化,使得后训练效果倍增。简单说,无需额外训练就能让模型“更聪明地思考”。

里约市政公司背后的开源浪潮:另一个Nex-N2-Pro已在路上

Rio 3.5并非孤例。本周早些时候,另一个基于Qwen3.5-397B-A17B的模型Nex-N2-Pro 397B也已发布,性能可媲美GPT-5.5和Opus 4.7。连续出现两个“基于后训练达到顶级水平”的案例,意味着开源社区已经掌握了一套高效的“复现”方法论:拿到高质量开源基座后,通过针对性后训练(尤其是推理效率优化)即可快速产出前沿模型。IplanRIO作为里约市政府IT部门,其成功也打破了“只有硅谷巨头才能研发SOTA大模型”的刻板印象,市政机构同样可以成为开源AI的强力贡献者。

全球AI格局:当里约与硅谷站在同一起跑线

业内人士认为,这一事件可能改变AI竞赛的叙事。此前,开源模型长期落后闭源模型一个迭代周期,而Rio 3.5的横空出世证明,只要基础模型足够强(如Qwen3.5)、后训练技术足够新(如SwiReasoning),小团队甚至政府部门都可以追平甚至超越商业闭源产品。Hugging Face CEO那句“AI的未来没有什么是注定的”正在成为现实:里约市政府、中国公司(Qwen)、全球开发者共同编织了一张去中心化的创新网,而这张网正以意想不到的方式重塑全球AI第一梯队的阵容。