V4 真要来了?DeepSeek 深夜突发上新
新模式上线,DeepSeek网页端界面更新
近日,DeepSeek网页端悄然上线了两个新功能:“快速模式”和“专家模式”。这一更新迅速引发了用户和开发者们的热议,因为这是DeepSeek首次引入模式分层设计,表明其在用户体验和任务处理上的进一步精细化。
- 快速模式:主打日常对话、即时响应,适合处理较为简单和快速的问答。支持上传图片和文件,但主要依赖OCR识别图片内容,尚未具备原生视觉感知能力。
- 专家模式:专注于复杂任务处理,如内容生成、代码编写、网页分析等,不支持多模态输入,但展现出更强的逻辑推理与生成能力。
值得一提的是,有网友直接询问专家模式的模型版本,其自称是“V4”,尽管未获官方证实,但这一行为无疑为V4的传言增添了更多热度。
V4传闻已久,多次跳票引发关注
DeepSeek V4的传闻从年初便持续不断。早在2026年1月,The Information曾报道其将在农历新年期间发布,随后又有消息称2月底将推出“V4 Lite”版本,代号为“Sealion-lite”,拥有高达100万token的上下文窗口并支持多模态推理。
但截至目前,V4仍未正式发布,引发了“狼来了”式的调侃。尽管如此,行业内普遍认为DeepSeek正在做最后的优化,这种“隐形进化”的方式可能正是其预发布阶段的信号。
V4的性能与架构曝光
从流出的信息来看,DeepSeek V4的性能令人瞩目,其关键指标包括:
- 200B参数起步,支持扩展至1T参数:基于mHC新架构,V4具备前所未有的扩展能力,可支撑更复杂的任务。
- 1M Token上下文窗口:可轻松处理大型文档或项目代码,实现更深层次的理解。
- 代码能力突出:在HumanEval榜单得分高达90%,SWE-bench超过80%,远超V3.2及其他竞品。
此外,V4还传出将支持原生多模态功能,包括图片、视频与文本的联合生成。有用户在网页端发现了一个名为“vision”的隐藏模式,进一步佐证了DeepSeek正在推进视觉感知能力的开发。
宕机事件或为V4上线铺垫
3月29日,DeepSeek经历了长达13小时的史诗级宕机,网页端和API服务几乎全线瘫痪。虽然起初被视为技术故障,但随后的更新和性能提升引发了猜测:这次宕机或许是V4上线前的重大部署。
在服务恢复后,用户发现网页端UI风格发生了明显变化,模型的底层逻辑也更加敏锐。有开发者表示,即便模型仍自称为V3,其响应质量已明显提升,疑似V4的轻量版本或蒸馏模型已在悄悄上线。
行业高度关注,竞争格局或将重塑
DeepSeek作为国产大模型的代表之一,其每次动作都牵动着AI行业的心弦。V4的迟迟未发反而加深了外界对其期待。目前,已有消息指出华为等国内厂商将获得早期访问权限,打破了以往优先海外厂商的惯例。
随着阿里、火山引擎、钉钉等平台陆续接入DeepSeek模型,其在企业端和开发者生态中的影响力正不断扩大。而如果V4如传闻般强悍,它或将对GPT-5.3、Claude 3.5 Opus等国际大模型构成实质性挑战。
总结
从新模式上线到疑似V4性能泄露,再到13小时宕机事件,DeepSeek近期的一系列动作都在指向一个信号:V4正在路上。尽管官方尚未正式宣布,但种种迹象表明,这一重大版本更新可能已进入最后阶段。期待DeepSeek真正“干就完事了”,带来更多突破与惊喜。