DeepSeek隐秘的深夜更新：一次关于“专家模式”的留客实验

1 个月前

AI资讯

18 阅读

背景：AI模型竞争白热化，用户需求日益垂直

在2026年的AI战场上，技术迭代的节奏已经从“按月计算”压缩到“按周推进”。国内仅在2026年1月1日至除夕期间，就有超过30起公开宣发且具备行业影响力的模型更新。国际市场也不遑多让，Meta、Google、Anthropic、OpenAI等巨头频繁推出新版本，保持技术热度。这种高频的技术脉冲，使得模型厂商不仅要“跑得快”，更要“跟得上”，否则就会被市场甩开。

与此同时，用户对AI模型的需求也变得更加垂直和专业。过去通用模型在大多数场景下尚可应付，但随着AI应用深入落地，用户更关注模型在复杂推理、代码生成、逻辑验证等方面的表现。这也意味着，仅靠一个“一招鲜”的通用模型已经难以满足市场需求。

升级详情：快速模式与专家模式分层上线

在此次深夜更新中，DeepSeek引入了两种模式：

快速模式：主打即时响应，适合日常对话，响应快，适合处理常规问题。
专家模式：强调复杂推理能力，擅长解决需要深度思考的任务，但在高峰时段需排队使用。

尽管专家模式被宣传为具备更强的分析与推理能力，实测发现它可能仍基于V4 Lite版本运行，尚未达到完整V4模型的预期性能。不过，与快速模式相比，专家模式在回答复杂问题时展现出更高的逻辑性与科学性。

例如在物理模拟任务“单摆运动数值模拟与周期计算”中，专家模式不仅计算了周期和误差，还引入了能量守恒验证和周期随角度变化的规律分析，这些正是科学计算中不可或缺的关键步骤。

技术局限与用户体验的权衡

尽管专家模式在“脑力”方面表现出色，但在处理图片、文档等多模态任务时却存在明显短板：

上传图片或文件时，系统直接报错或屏蔽上传按钮。
这意味着用户在面对图文混合内容时，只能切换回快速模式，牺牲推理深度换取视觉能力。

这也暴露出当前版本在功能完整性上的不足。一位不愿具名的大厂程序员指出：“这次更新更像是DeepSeek的一次压力测试，而非真正的产品发布。”

此外，部分用户反馈，DeepSeek在C端运营方面表现一般，缺乏客户端维护和用户引导，导致部分用户流向其他模型平台。尤其是在视觉交互尚未解锁的前提下，专家模式的应用场景仍有限。

战略意义：技术升级背后的“中国芯”路线

据多方消息透露，DeepSeek V4将运行于华为最新AI芯片之上，并正在开发至少两款完全基于国产芯片的模型。这不仅是技术层面的更新，更是对中国自主AI生态的一次探索。

在全球AI芯片供应紧张、英伟达H100租赁价格飙升的背景下，DeepSeek选择与国产芯片深度绑定，显示出其在算力供应链上的自主战略考量。此举不仅能降低对国外硬件的依赖，也符合国家对AI产业“自主可控”的整体导向。

不过，这条路并不容易。2026年3月29日，DeepSeek曾因服务异常大规模中断而登上热搜，核心功能如深度思考、长文本推理、代码生成一度受限。这暴露出在用户量迅速增长的同时，如何保障服务稳定性与算力供给，仍是其面临的严峻挑战。

未来展望：V4即将登场，能否带来“惊艳”？

根据市场推测，此次上线的两种模式很可能是V4系列发布前的铺垫：

DeepSeek V4 Lite：主打响应效率，适用于轻量级交互。
DeepSeek V4：专注于复杂推理，适合科研、工程等深度场景。
DeepSeek V4 Vision：支持视觉模态，实现图文理解与分析。

此外，V4从架构层面优化了“记忆”与“思考”模块，使训练成本大幅下降。以V3为例，其训练成本仅557.6万美元，远低于GPT-4等国际模型的1亿美元水平。

但技术实力与用户价值之间仍有鸿沟。正如强哥所言：“模型竞争已经从谁先跑出来变成谁跟得上。但最终决定用户去留的，是产品是否能持续提供不可替代的价值。”

在算力成本攀升、多模态需求激增的今天，DeepSeek是否能凭借专家模式和即将到来的V4系列稳住阵脚，仍有待观察。