Kimi K2 系列模型 API 官宣下线,将不再维护和支持

官宣下线:K2 系列定档2026年5月25日

Kimi API 开放平台官方文档正式确认,kimi-k2 系列模型将在 2026 年 5 月 25 日 全面下线,届时不再提供任何维护与技术支持。涉及下线的具体模型包括:

  • kimi-k2-0905-preview(256k 上下文,增强 Agentic Coding 能力)
  • kimi-k2-0711-preview(128k 上下文,MoE 架构基础模型)
  • kimi-k2-turbo-preview(高速版本,输出 60–100 tokens/秒)
  • kimi-k2-thinking(长思考模型,支持多步工具调用)
  • kimi-k2-thinking-turbo(长思考高速版)

与此同时,腾讯云等大模型服务平台也同步发布通知,提醒用户于该日期前完成代码中的 model 参数切换,否则将无法正常调用 K2 系列模型。此前已下线的 kimi-latestkimi-thinking-preview 同样不再可用,进一步加速了模型迭代的节奏。

从K2到K2.6:一次性能与功能的大幅跃升

随着 K2 系列退役,官方强力推荐的替代方案是 Kimi K2.6 模型。根据官方说明,K2.6 是“Kimi 迄今最智能的模型”,基于 K2.5 的积累在多个关键场景做出了显著升级:

  • 智能体编程(agentic coding):长程代码编写能力更强更稳,能够处理更复杂的多文件项目。
  • 长上下文推理:支持 256k 上下文窗口,可在超大语料中保持连贯推理。
  • 长周期执行:适应需要多步规划与持续交互的 Agent 任务。
  • 前端设计:在 UI/UX 生成的美观度和实用性上均有提升。

此外,K2.6 已通过 Kimi.com、Kimi App、API 以及 Kimi Code 上线,支持文本、图片、视频多模态输入,并可同时开启思考与非思考模式、工具调用、JSON Mode 等功能。实际评测显示,K2.5 已在 tool-use 场景大幅投入,而 K2.6 则进一步巩固了这一方向,避免了“单纯刷分”的老路。

开发者迁移指南:如何快速拥抱K2.6

用户需在 2026 年 5 月 25 日前完成 API 调用更新,主要步骤如下:

  1. 修改 model 参数:将原先的 kimi-k2-0905-previewkimi-k2-turbo-preview 等名称替换为 kimi-k2.6
  2. 确认 endpoints:通过阿里云 DashScope、腾讯云 TokenHub 等平台调用时,需确保 base_url 与 HTTP 请求地址与 K2.6 兼容。例如,多模态模型需使用 multimodal-generation 端点(如 https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation),纯文本模型则用 text-generation 端点。
  3. 测试与验证:在开发环境中先完成回归测试,确保新模型在 agentic coding、推理、工具调用等核心场景的输出符合预期。
  4. 监控与备用:必要时保留 K2.6 的降级或回退方案,同时留意官方后续可能推出的更新版本(如 K2.6 以上的新模型)。

阿里云已在华北2(北京)、美国(弗吉尼亚)、德国(法兰克福)提供 Kimi 系列模型的兼容端点,腾讯云同样公布了详细的迁移指引。开发者只需修改 model 名称与调用参数,即可无缝获得更强的推理能力与持续支持。