大模型“倒爷”微软:GPT带到东方,DeepSeek卖给西方
东方“搬运”GPT,西方“倒卖”DeepSeek
微软的“倒爷”本色体现在它同时扮演两个角色:在中国的云服务中引入GPT-4,供本土开发者调用;又在西方的Azure市场上架DeepSeek的R1模型,对标开源竞品。这种双向套利让微软不依赖任何单一阵营,而是把最热门的模型当作跨境商品——GPT卖给教培、金融等需要稳定闭源服务的中国客户,DeepSeek则面向追求高性价比的海外创业公司和研究者。有用户调侃:“微软左手是美国的GPT,右手是中国的DeepSeek,两手都要抓,两手都要硬。”

一夜爆红的R1:低成本打破垄断
今年一月,梁文峰领导的DeepSeek凭借R1模型迅速登上国际舞台。该模型在多个AI性能标准化测试中击败了西方主导的对手,而DeepSeek声称其基础模型的构建成本仅为GPT-4的极小部分。这一“性价比炸弹”震动了整个行业——开发者发现用DeepSeek做推理任务,账单只有调用GPT的十分之一甚至更低。一位硅谷工程师在推特上写道:“DeepSeek R1让我重新理解了‘性价比’三个字,它不是便宜,是便宜得让人怀疑定价错误。”
云厂商的“抢滩”大战:从API到服务器
DeepSeek爆红后的第一个周末,亚马逊和微软就迅速将其模型加入云服务产品,与Meta的Llama和Mistral AI并列。亚马逊语言模型市场负责人Atul Deo坦言:“基本上,DeepSeek的关注度在一个周末就追平了我们平台上最热门的开源模型。”微软更是不遗余力,在Azure上专门优化了DeepSeek的部署指南,并提供预配置的GPU实例。两边都清楚:谁先让用户用上DeepSeek,谁就能在这一波低成本AI浪潮中吸引更多开发者、留住付费客户。
“服务器繁忙”背后:爆火后的甜蜜负担
然而,用户端的体验却没那么美好。正在用DeepSeek赶论文的大学生发现对话框突然卡死,已经生成了一半的长文凭空消失;靠它写代码的开发者被“服务器繁忙,请稍后重试”拦在门外;用它处理日报的打工人对着空白屏幕焦急等待。DeepSeek的免费API在流量洪峰中频繁过载,这反而给了微软Azure等商业云服务机会——它们推出收费但稳定的DeepSeek托管方案,将免费用户转化为付费客户。一位云服务销售私下表示:“DeepSeek越卡,我们的倒卖生意越好做。”这正是倒爷微软的算盘:无论模型来自东方还是西方,只要流量和算力经过自己的管道,就能赚到钱。