Anthropic 和 OpenAI 模型太贵,微软智能体考虑使用 DeepSeek V4 微调版

微软Copilot Cowork寻求更实惠的AI引擎

据最新报道,微软内部透露,其智能体产品Copilot Cowork目前日常依赖于Anthropic或OpenAI的顶尖模型,但高昂的API调用费用正成为规模化部署的沉重负担。为此,微软已开始探索基于DeepSeek V4或其他开源模型的微调版本,作为更具性价比的替代驱动力。这一动向直指AI行业的核心矛盾:最强模型往往最贵,而企业级生产环境对成本极度敏感。微软的探索,标志着大型科技公司在“性能”与“成本”之间,正试图找到一条更务实的平衡路径。

DeepSeek V4 Pro与Fusion:国产模型的破局之道

DeepSeek V4 Pro以其超低定价(近期API甚至打2.5折)和接近前沿的性能,成为微软等巨头眼中的性价比之选。但更关键的支撑来自Fusion技术——由OpenRouter推出的多模型动态路由与合成机制。其核心逻辑是将复杂任务并行分发给多个模型,再由一个评判模型融合结果。例如,让GPT-5.5和Opus 4.8写架构,让DeepSeek V4 Pro写具体代码。在DRACO深度研究基准测试中,由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组成的“预算型模型组”,不仅击败了单一的GPT-5.5,得分还逼近顶级前沿模型组合,成本仅为其50%。这表明,国产模型无需在所有维度硬刚御三家,只需在长文本处理、基础代码生成等领域做到及格线以上,并维持极具竞争力的定价,就能在混合智能体架构中占据关键位置。

Anthropic 和 OpenAI 模型太贵,微软智能体考虑使用 DeepSeek V4 微调版

从“国产替代”到“算力杠杆”:多模型动态路由的价值

过去,国产模型往往被贴上“玩具”标签,试图在极限推理上追赶Anthropic和OpenAI。但现实是,企业级智能体架构不应用一个强大模型单打独斗。更合理的“混合智能体架构(MoA)”分为两部分:一是调度与评判的“大脑”,由Anthropic和OpenAI旗舰模型担任,占据不到一半的token份额,负责核心推理;二是执行与干活的“主力”,由DeepSeek、GLM、Kimi等模型担任,处理海量文档阅读、大规模并行搜索和基础代码编写,占用超过一半的token。通过这种“高低搭配”,国产模型成功从“前沿模型的国产替代”转型为“前沿模型的算力杠杆”。微软的Copilot Cowork若能采用DeepSeek V4微调版作为主力,将极大降低整体运营成本,同时保持任务完成质量。

元框架Omnigent:破解供应商锁定,为用户夺回控制权

模型与智能体环境(如Claude Code、Codex)的强绑定,让企业一旦适配某家生态,便难以切换底层模型,被迫承担高昂成本。Databricks开源的Omnigent被定位为“元框架”,它构建统一API,实现三种颠覆性功能:

  • 无缝切换:用户可用一行代码将逻辑节点从Claude切换为自定义模型,或在一个项目中同时调用Codex和多个自建智能体。
  • 成本管控:用户可设置硬性上限,例如当某会话token消耗达100美元时自动冻结,无需手动查询各供应商。
  • 打破封闭:提供中立的抽象层,瓦解Anthropic、OpenAI等巨头的供应商锁定(Vendor Lock-in)策略。

对于微软而言,若能将Copilot Cowork构建在类似Omnigent的元框架上,就能自由选择最经济的模型(如DeepSeek V4微调版)作为主力,同时保留必要时调用顶级模型的能力,实现成本与灵活性的兼得。

重塑价值链:算力层、认知层与管控层的重构

AI行业正从“模型中心主义”转向“架构中心主义”。未来的AI智能体价值链将分为三层:

  • 算力执行层:国产模型凭借极致性价比,承接大量基础“搬砖”工作(如数据抓取、格式转换、基础代码),彻底摆脱玩具命运,成为不可或缺的基石。
  • 认知评判层:御三家旗舰模型退居二线,作为总揽全局的工程师,在Fusion动态路由下负责高难度核心收敛。
  • 管控交互层:依托Omnigent等元框架,打破厂商封闭,实现跨模型跨框架的无缝协作、预算管控和安全隔离。

微软考虑使用DeepSeek V4微调版,正是这一趋势的缩影——当算力、智力、成本与中立基础设施实现系统化匹配,AI智能体才能真正从“科技盲盒”迈入工业流水线。