刚刚，中国AI闯入全球编程前二，前面只剩Claude

1 个月前

AI资讯

54 阅读

阿里云 AI 编程 Qwen3.7-Max

在最新的编程能力基准评测中，阿里云旗下的Qwen3.7-Max以1541分的成绩杀入全球前四，并最终锁定了第二名的位置。这一成绩直接超越了GPT-5.5、Gemini 3.5 Flash等一众国际顶尖模型，显示出中国AI在代码生成与理解领域的惊人突破。

根据公布的排名，Qwen3.7-Max的1541分不仅大幅领先GPT-5.5和Gemini 3.5 Flash，还将其他主流模型甩在身后。评测方指出，该模型在复杂编程任务、算法优化及bug修复等多个维度均表现出色，成为榜单上最令人意外的“黑马”。

刚刚，中国AI闯入全球编程前二，前面只剩Claude

目前排在Qwen3.7-Max之前的两款模型，分别是Claude Opus 4.7和Claude Opus 4.6。这意味着中国AI已经进入了全球编程能力的顶级俱乐部，距离榜首仅一步之遥。不少开发者分析，若Qwen系列持续迭代，未来完全有可能挑战Claude的霸主地位。

在评测中，一个反直觉的细节引起了广泛关注：Qwen3.7-Max是四个模型里唯一成功吃掉“bonus得分”的选手，成功实现了引擎声和金币叮咚声等特殊效果的代码生成。这说明该模型不仅理解常规编程语法，还能精准执行隐含的、非显式的额外要求，体现出更强的泛化与上下文理解能力。

有评论指出，Qwen3.7-Max本身并非纯开源模型，但其衍生版本（如Hermes系列）在Python任务上已首次击败OpenAI Codex，印证了国内开源社区的协作创新。此次排名跃升不仅为阿里云的千问品牌赢得了国际关注，也标志着中国大模型在编程赛道上从“追赶者”正式转变为“顶尖竞争者”。