Python逆天改命,开源Hermes首次击败OpenAI Codex

3 天前
7 阅读

Hermes上演工程暴力美学,纯Python秒杀Rust王牌

新智元报道,一个完全由Python编写的开源代码生成项目Hermes,在最新评测中以6比5的总比分战胜了OpenAI用Rust语言开发的旗舰模型Codex。这场胜利被开发者称为“解释型语言的逆天改命”——Python作为动态解释型语言,通常被认为在性能上不如Rust等编译型语言,但Hermes通过精巧的工程优化和纯Python栈的极致打磨,硬生生将性能差距抹平,甚至反超。

6比5:一场代码生成领域的实力对决

比拼在特定代码生成基准上展开,Hermes与Codex各完成11项任务测试,最终Hermes拿下其中6胜,Codex仅获5胜。尽管Codex在部分复杂逻辑推理任务中仍占优,但Hermes在函数调优、API调用、文档生成等实用场景全面领先。更令人震惊的是,Hermes所有模型权重和训练代码均开源,而Codex是闭源商业模型——这场胜利不仅是技术上的,更是开源社区对闭源巨头的反攻号角。

Python逆天改命,开源Hermes首次击败OpenAI Codex

解释型语言为何能逆天改命?

长期以来,Python被视为“胶水语言”,其性能瓶颈常被归咎于解释执行和全局解释器锁(GIL)。但Hermes的工程师团队并未试图重写底层运行时,而是针对代码生成任务做了三点突破:

  • 轻量化模型架构:使用纯Python的Transformer实现,在内存和计算图上极致精简,避免Rust版本常见的冗余编译优化开销。
  • 数据飞轮策略:利用开源社区的持续反馈,高频迭代训练数据,使模型在特定领域形成“局部最优”。
  • 短路执行技巧:对于简单生成任务,直接绕过大模型推理,用Python的字符串模板和语法树快速输出,大幅降低延迟。

这种“工程暴力美学”让开源社区看到:当算法足够聪明,语言本身的“快慢”在任务层面的实际体验差距可以被彻底抹平。

开源社区沸腾:工程师的暴力美学

Hermes的胜利迅速点燃了Python和开源社区。开发者们纷纷表示:“这不仅是解释型语言的胜利,更是工程执着精神的胜利。”有人指出,OpenAI之所以选择Rust构建Codex,本意是利用其内存安全和并发性能,但Hermes用纯Python证明了“正确的设计比正确的语言更重要”。目前Hermes的GitHub星标已飙升,社区正计划将胜利扩展到更多代码生成子任务,并挑战OpenAI最新发布的GPT-4o内置代码能力。这场6比5的比分,或许只是开源碾压闭源的序章。