微软 GitHub 推出跨模型 AI 审查：Claude Sonnet 4.6 搭配 GPT-5.4，弥补 74.7% 性能差距

1 个月前

AI资讯

40 阅读

性能优化多模型协作 [AI代码审查微软GitHub]

背景

近年来，AI 代码辅助工具在软件开发中扮演着越来越重要的角色。GitHub 的 Copilot 项目最初基于 Codex 模型，虽然在代码生成方面表现出色，但其性能在不同任务和语言中存在显著差异。为了解决这一问题，微软 GitHub 最近推出了跨模型 AI 审查机制，利用 Claude Sonnet 4.6 与 GPT-5.4 的组合，实现性能协同优化，缩小了模型间的能力差距。

跨模型 AI 审查机制详情

微软 GitHub 的这项新机制主要通过以下几个方面来实现性能优化：

微软 GitHub 推出跨模型 AI 审查：Claude Sonnet 4.6 搭配 GPT-5.4，弥补 74.7% 性能差距

模型融合策略：在代码生成过程中，系统会根据任务类型自动选择最佳模型，或结合两个模型的结果进行综合判断。
动态错误率评估：Claude Sonnet 4.6 在测试中错误率比 GPT-5.2 降低了 33%，系统利用这一点在审查时优先采用 Sonnet 处理复杂逻辑问题。
上下文扩展能力：通过支持高达 1M 令牌的上下文长度，使得两个模型都能更好地理解代码的结构和语义，从而提高生成质量。
Codex 模型整合：此次更新还将 Codex 模型功能整合至主模型中，增强了对历史代码和专有结构的理解能力。

这一机制的目标是通过模型间的协作，提升代码建议的准确率和实用性，尤其在处理多语言、复杂结构项目时表现更为稳定。