V4 真要来了?DeepSeek 深夜突发上新

新模式上线,DeepSeek网页端界面更新

近日,DeepSeek网页端悄然上线了两个新功能:“快速模式”和“专家模式”。这一更新迅速引发了用户和开发者们的热议,因为这是DeepSeek首次引入模式分层设计,表明其在用户体验和任务处理上的进一步精细化。

  • 快速模式:主打日常对话、即时响应,适合处理较为简单和快速的问答。支持上传图片和文件,但主要依赖OCR识别图片内容,尚未具备原生视觉感知能力。
  • 专家模式:专注于复杂任务处理,如内容生成、代码编写、网页分析等,不支持多模态输入,但展现出更强的逻辑推理与生成能力。

值得一提的是,有网友直接询问专家模式的模型版本,其自称是“V4”,尽管未获官方证实,但这一行为无疑为V4的传言增添了更多热度。

V4传闻已久,多次跳票引发关注

DeepSeek V4的传闻从年初便持续不断。早在2026年1月,The Information曾报道其将在农历新年期间发布,随后又有消息称2月底将推出“V4 Lite”版本,代号为“Sealion-lite”,拥有高达100万token的上下文窗口并支持多模态推理。

但截至目前,V4仍未正式发布,引发了“狼来了”式的调侃。尽管如此,行业内普遍认为DeepSeek正在做最后的优化,这种“隐形进化”的方式可能正是其预发布阶段的信号。

V4的性能与架构曝光

从流出的信息来看,DeepSeek V4的性能令人瞩目,其关键指标包括:

  1. 200B参数起步,支持扩展至1T参数:基于mHC新架构,V4具备前所未有的扩展能力,可支撑更复杂的任务。
  2. 1M Token上下文窗口:可轻松处理大型文档或项目代码,实现更深层次的理解。
  3. 代码能力突出:在HumanEval榜单得分高达90%,SWE-bench超过80%,远超V3.2及其他竞品。

此外,V4还传出将支持原生多模态功能,包括图片、视频与文本的联合生成。有用户在网页端发现了一个名为“vision”的隐藏模式,进一步佐证了DeepSeek正在推进视觉感知能力的开发。

宕机事件或为V4上线铺垫

3月29日,DeepSeek经历了长达13小时的史诗级宕机,网页端和API服务几乎全线瘫痪。虽然起初被视为技术故障,但随后的更新和性能提升引发了猜测:这次宕机或许是V4上线前的重大部署。

在服务恢复后,用户发现网页端UI风格发生了明显变化,模型的底层逻辑也更加敏锐。有开发者表示,即便模型仍自称为V3,其响应质量已明显提升,疑似V4的轻量版本或蒸馏模型已在悄悄上线。

行业高度关注,竞争格局或将重塑

DeepSeek作为国产大模型的代表之一,其每次动作都牵动着AI行业的心弦。V4的迟迟未发反而加深了外界对其期待。目前,已有消息指出华为等国内厂商将获得早期访问权限,打破了以往优先海外厂商的惯例。

随着阿里、火山引擎、钉钉等平台陆续接入DeepSeek模型,其在企业端和开发者生态中的影响力正不断扩大。而如果V4如传闻般强悍,它或将对GPT-5.3、Claude 3.5 Opus等国际大模型构成实质性挑战。

总结

从新模式上线到疑似V4性能泄露,再到13小时宕机事件,DeepSeek近期的一系列动作都在指向一个信号:V4正在路上。尽管官方尚未正式宣布,但种种迹象表明,这一重大版本更新可能已进入最后阶段。期待DeepSeek真正“干就完事了”,带来更多突破与惊喜。