月之暗面 Kimi Work Beta 版开启内测:面向知识工作者的通用型本地 Agent

从基座模型到“模型即Agent”的战略跃迁

月之暗面在沉寂半年后,于近期连续发布涵盖Kimi K2、K2.5及K2.6系列的模型更新,并同步推出了Kimi Work Beta版。这款产品并非简单的模型升级,而是其“模型即Agent”战略的关键落地。根据官方介绍,Kimi Work依托于最新的Kimi K2系列模型——一款总参数达1万亿、激活参数320亿的MoE架构基础模型。该模型在自主编程、工具调用和数学推理能力评测中,不仅超越了DeepSeek-V3、Qwen3等主流开源模型,其后训练版本Kimi-K2-Instruct更是在SWE-bench Verified和AIME 2025等评价基准上,逼近甚至反超了OpenAI GPT-4.1和Claude 4 Opus等闭源巨头。

用1万亿参数铸就的“超级本地大脑”

Kimi Work Beta版的核心是其本地化的Agent能力,这一能力来自于K2模型独有的技术迭代。月之暗面在训练这座万亿参数模型时,采用了自研的Muon优化器及稳定性增强技术MuonClip,使之在15.5万亿tokens的预训练中保持高效与稳定。值得注意的是,这是国内首个开源的万亿参数级别大模型。模型本身集成了自主决策和执行任务的能力,上下文长度支持128k,并已规划加入更强视觉理解能力。这确保了Kimi Work在本地端,能够作为智能体独立解决知识工作者面临的复杂、多步骤任务,而不仅仅是提供问答。

一键生成报告、规划旅行:看Kimi Work如何完成23步推理

在官方释出的实际用例中,Kimi Work展现出了惊人的复杂任务处理能力。用户要求其规划参加Coldplay乐队巡演的完整行程,该Agent通过17次工具调用,自主完成了从搜索航班、酒店信息,到调用日历、邮箱进行日程安排,再到餐厅预订的全流程,最终生成可视化的完整出游报告。这得益于其端到端的智能体强化学习训练,平均每项任务可执行23个推理步骤,并访问超过200个网址进行深度信息核实。这种深度研究与自动化操作结合的能力,让“一键建站”、“智能制表”和“PPT自主编辑”等原本需要多种软件配合的复杂工作,变得触手可及。

告别“人类化石燃料”:重新定义知识工作者的AI助理

面对当前大模型领域对“人类数据是有限化石燃料”的共识,Kimi Work的设计思路彻底转向了自我优化。其背后的K2模型在后训练阶段,已不再单纯依赖人类标注的数据,而是通过从自身行为与结果中获得奖励信号,实现超越人类能力边界的指数级提升。对于知识工作者而言,这意味着Kimi Work不再是需要频繁人工干预的辅助工具,而是一个能自主规划、试错、迭代并完成交付的通用型本地Agent。在xAI发布Grok 4、Anthropic强调Claude 4 Agent能力的行业潮流中,月之暗面通过Kimi Work的Beta版内测,正将自己重新拉回大模型牌局的中心位置。