DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

1 个月前

AI资讯

56 阅读

DeepSeek API V4 价格优惠缓存命中

缓存命中价格永久降至1/10，V4-Pro仅需0.025元

DeepSeek于4月26日宣布全系列API输入缓存命中价格永久下调至首发价的十分之一。V4-Flash模型百万tokens仅需0.02元，V4-Pro模型降至0.1元。若叠加此前开启的2.5折限时特惠，V4-Pro实际支付价格仅为0.025元——仅为OpenAI GPT-5.5缓存输入价格（约3.4元）的1/136。DeepSeek的缓存优化本就突出，V4-Pro缓存命中率约95%，V4-Flash约91%，意味着绝大多数token按最低价格结算，进一步拉低真实使用成本。

2.5折特惠延长至5月底，开发者抢搭“末班车”

原定于5月6日结束的V4-Pro 2.5折限时优惠已确认延长至5月31日23:59。当前V4-Pro输入价格（缓存未命中）为3元，输出价格6元，但凭借高命中率，多数场景下单价远低于标价。这一延期为开发者和企业用户腾出更充裕的迁移窗口，结合永久降价的缓存价格，可稳定实现约2折的实际到手成本。有测算显示，在典型编程任务中，成本相比之前骤降83%。

Agent与编码能力登顶开源，数学成绩比肩闭源旗舰

性能层面，V4-Pro在Agent能力上达到开源模型最佳水平，Agentic Coding使用体验甚至优于闭源的Claude Sonnet 4.5。在世界知识测评中，V4大幅领先其他开源模型，仅次于谷歌Gemini-3.1-Pro。在数学、STEM及竞赛型代码测评中，V4超越所有已公开开源模型，与顶级闭源模型持平。尽管在整体智能指数上仍落后顶尖闭源产品，但其性价比碾压对手——完成相同测试的成本仅为Anthropic Claude Opus 4.7的约四十分之一。

调用量一日暴增近4倍，OpenRouter数据显示需求井喷

极具竞争力的价格迅速引爆市场。据OpenRouter报告，4月25日DeepSeek-V4-Pro调用量达到136亿Token，较前一日增长近四倍。这一增速侧面反映开发者对低成本高性能模型的高度敏感，也验证了DeepSeek“以价换量”策略的有效性。分析人士指出，此举旨在吸引更多企业用户与开发者，巩固其在开源AI生态中的核心地位。

昇腾超节点即将批量上市，Pro价格仍有巨大下探空间

DeepSeek已确认，受限于高端算力，目前V4-Pro服务吞吐较为有限。预计下半年昇腾950超节点批量上市后，Pro版本的价格还将大幅下调。昇腾超节点全系列产品已全面适配DeepSeek-V4，这一国产AI算力生态的协同效应将进一步提升成本竞争力，支持更广泛的复杂Agent应用普及。届时全球AI定价体系可能面临进一步重塑。