Anthropic 和 OpenAI 模型太贵，微软智能体考虑使用 DeepSeek V4 微调版

6 天前

AI资讯

31 阅读

DeepSeek 开源模型 AI成本 V4 微软智能体

微软Copilot Cowork寻求更实惠的AI引擎

据最新报道，微软内部透露，其智能体产品Copilot Cowork目前日常依赖于Anthropic或OpenAI的顶尖模型，但高昂的API调用费用正成为规模化部署的沉重负担。为此，微软已开始探索基于DeepSeek V4或其他开源模型的微调版本，作为更具性价比的替代驱动力。这一动向直指AI行业的核心矛盾：最强模型往往最贵，而企业级生产环境对成本极度敏感。微软的探索，标志着大型科技公司在“性能”与“成本”之间，正试图找到一条更务实的平衡路径。

DeepSeek V4 Pro与Fusion：国产模型的破局之道

DeepSeek V4 Pro以其超低定价（近期API甚至打2.5折）和接近前沿的性能，成为微软等巨头眼中的性价比之选。但更关键的支撑来自Fusion技术——由OpenRouter推出的多模型动态路由与合成机制。其核心逻辑是将复杂任务并行分发给多个模型，再由一个评判模型融合结果。例如，让GPT-5.5和Opus 4.8写架构，让DeepSeek V4 Pro写具体代码。在DRACO深度研究基准测试中，由Gemini 3 Flash、Kimi K2.6和DeepSeek V4 Pro组成的“预算型模型组”，不仅击败了单一的GPT-5.5，得分还逼近顶级前沿模型组合，成本仅为其50%。这表明，国产模型无需在所有维度硬刚御三家，只需在长文本处理、基础代码生成等领域做到及格线以上，并维持极具竞争力的定价，就能在混合智能体架构中占据关键位置。

Anthropic 和 OpenAI 模型太贵，微软智能体考虑使用 DeepSeek V4 微调版

从“国产替代”到“算力杠杆”：多模型动态路由的价值

过去，国产模型往往被贴上“玩具”标签，试图在极限推理上追赶Anthropic和OpenAI。但现实是，企业级智能体架构不应用一个强大模型单打独斗。更合理的“混合智能体架构（MoA）”分为两部分：一是调度与评判的“大脑”，由Anthropic和OpenAI旗舰模型担任，占据不到一半的token份额，负责核心推理；二是执行与干活的“主力”，由DeepSeek、GLM、Kimi等模型担任，处理海量文档阅读、大规模并行搜索和基础代码编写，占用超过一半的token。通过这种“高低搭配”，国产模型成功从“前沿模型的国产替代”转型为“前沿模型的算力杠杆”。微软的Copilot Cowork若能采用DeepSeek V4微调版作为主力，将极大降低整体运营成本，同时保持任务完成质量。

元框架Omnigent：破解供应商锁定，为用户夺回控制权

模型与智能体环境（如Claude Code、Codex）的强绑定，让企业一旦适配某家生态，便难以切换底层模型，被迫承担高昂成本。Databricks开源的Omnigent被定位为“元框架”，它构建统一API，实现三种颠覆性功能：

无缝切换：用户可用一行代码将逻辑节点从Claude切换为自定义模型，或在一个项目中同时调用Codex和多个自建智能体。
成本管控：用户可设置硬性上限，例如当某会话token消耗达100美元时自动冻结，无需手动查询各供应商。
打破封闭：提供中立的抽象层，瓦解Anthropic、OpenAI等巨头的供应商锁定（Vendor Lock-in）策略。

对于微软而言，若能将Copilot Cowork构建在类似Omnigent的元框架上，就能自由选择最经济的模型（如DeepSeek V4微调版）作为主力，同时保留必要时调用顶级模型的能力，实现成本与灵活性的兼得。

重塑价值链：算力层、认知层与管控层的重构

AI行业正从“模型中心主义”转向“架构中心主义”。未来的AI智能体价值链将分为三层：

算力执行层：国产模型凭借极致性价比，承接大量基础“搬砖”工作（如数据抓取、格式转换、基础代码），彻底摆脱玩具命运，成为不可或缺的基石。
认知评判层：御三家旗舰模型退居二线，作为总揽全局的工程师，在Fusion动态路由下负责高难度核心收敛。
管控交互层：依托Omnigent等元框架，打破厂商封闭，实现跨模型跨框架的无缝协作、预算管控和安全隔离。

微软考虑使用DeepSeek V4微调版，正是这一趋势的缩影——当算力、智力、成本与中立基础设施实现系统化匹配，AI智能体才能真正从“科技盲盒”迈入工业流水线。

Anthropic 和 OpenAI 模型太贵，微软智能体考虑使用 DeepSeek V4 微调版

微软Copilot Cowork寻求更实惠的AI引擎

DeepSeek V4 Pro与Fusion：国产模型的破局之道

从“国产替代”到“算力杠杆”：多模型动态路由的价值

元框架Omnigent：破解供应商锁定，为用户夺回控制权

重塑价值链：算力层、认知层与管控层的重构

链接失效反馈