DeepSeek V4还能更省!新工具缓存命中率高达99.82%,2折稳定到手

缓存命中价格永久降至1/10,V4-Pro仅需0.025元

DeepSeek于4月26日宣布全系列API输入缓存命中价格永久下调至首发价的十分之一。V4-Flash模型百万tokens仅需0.02元,V4-Pro模型降至0.1元。若叠加此前开启的2.5折限时特惠,V4-Pro实际支付价格仅为0.025元——仅为OpenAI GPT-5.5缓存输入价格(约3.4元)的1/136。DeepSeek的缓存优化本就突出,V4-Pro缓存命中率约95%,V4-Flash约91%,意味着绝大多数token按最低价格结算,进一步拉低真实使用成本。

2.5折特惠延长至5月底,开发者抢搭“末班车”

原定于5月6日结束的V4-Pro 2.5折限时优惠已确认延长至5月31日23:59。当前V4-Pro输入价格(缓存未命中)为3元,输出价格6元,但凭借高命中率,多数场景下单价远低于标价。这一延期为开发者和企业用户腾出更充裕的迁移窗口,结合永久降价的缓存价格,可稳定实现约2折的实际到手成本。有测算显示,在典型编程任务中,成本相比之前骤降83%。

Agent与编码能力登顶开源,数学成绩比肩闭源旗舰

性能层面,V4-Pro在Agent能力上达到开源模型最佳水平,Agentic Coding使用体验甚至优于闭源的Claude Sonnet 4.5。在世界知识测评中,V4大幅领先其他开源模型,仅次于谷歌Gemini-3.1-Pro。在数学、STEM及竞赛型代码测评中,V4超越所有已公开开源模型,与顶级闭源模型持平。尽管在整体智能指数上仍落后顶尖闭源产品,但其性价比碾压对手——完成相同测试的成本仅为Anthropic Claude Opus 4.7的约四十分之一。

调用量一日暴增近4倍,OpenRouter数据显示需求井喷

极具竞争力的价格迅速引爆市场。据OpenRouter报告,4月25日DeepSeek-V4-Pro调用量达到136亿Token,较前一日增长近四倍。这一增速侧面反映开发者对低成本高性能模型的高度敏感,也验证了DeepSeek“以价换量”策略的有效性。分析人士指出,此举旨在吸引更多企业用户与开发者,巩固其在开源AI生态中的核心地位。

昇腾超节点即将批量上市,Pro价格仍有巨大下探空间

DeepSeek已确认,受限于高端算力,目前V4-Pro服务吞吐较为有限。预计下半年昇腾950超节点批量上市后,Pro版本的价格还将大幅下调。昇腾超节点全系列产品已全面适配DeepSeek-V4,这一国产AI算力生态的协同效应将进一步提升成本竞争力,支持更广泛的复杂Agent应用普及。届时全球AI定价体系可能面临进一步重塑。