刚刚,中国AI闯入全球编程前二,前面只剩Claude

Qwen3.7-Max跃居全球编程榜第二

在最新的编程能力基准评测中,阿里云旗下的Qwen3.7-Max以1541分的成绩杀入全球前四,并最终锁定了第二名的位置。这一成绩直接超越了GPT-5.5、Gemini 3.5 Flash等一众国际顶尖模型,显示出中国AI在代码生成与理解领域的惊人突破。

强势碾压:一举超越GPT-5.5与Gemini

根据公布的排名,Qwen3.7-Max的1541分不仅大幅领先GPT-5.5和Gemini 3.5 Flash,还将其他主流模型甩在身后。评测方指出,该模型在复杂编程任务、算法优化及bug修复等多个维度均表现出色,成为榜单上最令人意外的“黑马”。

刚刚,中国AI闯入全球编程前二,前面只剩Claude

前方仅剩Claude Opus系列

目前排在Qwen3.7-Max之前的两款模型,分别是Claude Opus 4.7和Claude Opus 4.6。这意味着中国AI已经进入了全球编程能力的顶级俱乐部,距离榜首仅一步之遥。不少开发者分析,若Qwen系列持续迭代,未来完全有可能挑战Claude的霸主地位。

神秘bonus得分揭示独特技术路径

在评测中,一个反直觉的细节引起了广泛关注:Qwen3.7-Max是四个模型里唯一成功吃掉“bonus得分”的选手,成功实现了引擎声和金币叮咚声等特殊效果的代码生成。这说明该模型不仅理解常规编程语法,还能精准执行隐含的、非显式的额外要求,体现出更强的泛化与上下文理解能力。

开源与商业化并行:中国AI加速追赶

有评论指出,Qwen3.7-Max本身并非纯开源模型,但其衍生版本(如Hermes系列)在Python任务上已首次击败OpenAI Codex,印证了国内开源社区的协作创新。此次排名跃升不仅为阿里云的千问品牌赢得了国际关注,也标志着中国大模型在编程赛道上从“追赶者”正式转变为“顶尖竞争者”。