AI圈懵了：一家巴西市政IT公司开源的大模型，杀进了全球第一梯队

9 小时前

AI资讯

2 阅读

大模型开源巴西 AI突破

推特博主集体震惊：从没听过的模型秒变开源SOTA

当Hugging Face社区出现名为“Rio 3.5”的模型时，多数人以为只是个普通的水文或市政项目。然而测试结果令人咋舌：该模型在智能体编程、数学、STEM、多语言和多模态基准上均达到开源领先水平，直接压过原来开源阵营的霸主Qwen 3.7。推特博主“Chubby”感叹：“一个以前从来没听过的模型现在成了开源SOTA，甚至超过了Qwen 3.7。”Hugging Face联合创始人兼CEO Clem Delangue随即发文：“AI的未来没有什么是注定的……路径一：闭源API，路径二：开源AI，包括里约市这样的机构。选你的路吧。”一时间，里约市政公司成为AI圈最意外的名字。

技术拆解：397B参数、百万级上下文，MIT许可证完全开放

Rio 3.5 Open 397B基于通义千问的Qwen 3.5-397B-A17B进行后训练，采用混合专家（MoE）架构：总参数397B，激活参数仅17B，大幅降低推理成本。最引人注目的是上下文窗口达到1,010,000 token，即百万级别，足以处理超长文档或代码库。许可证采用MIT，完全开源，可用于商业和研究，这意味着任何个人或企业都可直接部署甚至二次开发。开源地址已在Hugging Face上线（prefeitura-rio/Rio-3.5-Open-397B），基础模型Qwen 3.5的权重也为开源社区提供了“再训练”的起点。

AI圈懵了：一家巴西市政IT公司开源的大模型，杀进了全球第一梯队

SwiReasoning：免训练推理框架让效率和精度双赢

该模型性能提升的关键在于集成了一种名为SwiReasoning的免训练推理框架。该框架基于Shi等人2025年的研究论文（arXiv:2510.05069），可根据熵值实时判断何时进行显式思维链推理、何时进行潜空间推理。这样既保持了推理准确性，又大幅节省token消耗——尤其在复杂数学和编程任务中，效率提升显著。模型训练也特意针对潜空间推理的收益做了优化，使得后训练效果倍增。简单说，无需额外训练就能让模型“更聪明地思考”。

里约市政公司背后的开源浪潮：另一个Nex-N2-Pro已在路上

Rio 3.5并非孤例。本周早些时候，另一个基于Qwen3.5-397B-A17B的模型Nex-N2-Pro 397B也已发布，性能可媲美GPT-5.5和Opus 4.7。连续出现两个“基于后训练达到顶级水平”的案例，意味着开源社区已经掌握了一套高效的“复现”方法论：拿到高质量开源基座后，通过针对性后训练（尤其是推理效率优化）即可快速产出前沿模型。IplanRIO作为里约市政府IT部门，其成功也打破了“只有硅谷巨头才能研发SOTA大模型”的刻板印象，市政机构同样可以成为开源AI的强力贡献者。

全球AI格局：当里约与硅谷站在同一起跑线

业内人士认为，这一事件可能改变AI竞赛的叙事。此前，开源模型长期落后闭源模型一个迭代周期，而Rio 3.5的横空出世证明，只要基础模型足够强（如Qwen3.5）、后训练技术足够新（如SwiReasoning），小团队甚至政府部门都可以追平甚至超越商业闭源产品。Hugging Face CEO那句“AI的未来没有什么是注定的”正在成为现实：里约市政府、中国公司（Qwen）、全球开发者共同编织了一张去中心化的创新网，而这张网正以意想不到的方式重塑全球AI第一梯队的阵容。

AI圈懵了：一家巴西市政IT公司开源的大模型，杀进了全球第一梯队

推特博主集体震惊：从没听过的模型秒变开源SOTA

技术拆解：397B参数、百万级上下文，MIT许可证完全开放

SwiReasoning：免训练推理框架让效率和精度双赢

里约市政公司背后的开源浪潮：另一个Nex-N2-Pro已在路上

全球AI格局：当里约与硅谷站在同一起跑线

链接失效反馈