Kimi K2 系列模型 API 官宣下线，将不再维护和支持

1 个月前

AI资讯

68 阅读

Kimi 2026 K2 API下线模型维护

官宣下线：K2 系列定档2026年5月25日

Kimi API 开放平台官方文档正式确认，kimi-k2 系列模型将在 2026 年 5 月 25 日 全面下线，届时不再提供任何维护与技术支持。涉及下线的具体模型包括：

kimi-k2-0905-preview（256k 上下文，增强 Agentic Coding 能力）
kimi-k2-0711-preview（128k 上下文，MoE 架构基础模型）
kimi-k2-turbo-preview（高速版本，输出 60–100 tokens/秒）
kimi-k2-thinking（长思考模型，支持多步工具调用）
kimi-k2-thinking-turbo（长思考高速版）

与此同时，腾讯云等大模型服务平台也同步发布通知，提醒用户于该日期前完成代码中的 model 参数切换，否则将无法正常调用 K2 系列模型。此前已下线的 kimi-latest 和 kimi-thinking-preview 同样不再可用，进一步加速了模型迭代的节奏。

从K2到K2.6：一次性能与功能的大幅跃升

随着 K2 系列退役，官方强力推荐的替代方案是 Kimi K2.6 模型。根据官方说明，K2.6 是“Kimi 迄今最智能的模型”，基于 K2.5 的积累在多个关键场景做出了显著升级：

智能体编程（agentic coding）：长程代码编写能力更强更稳，能够处理更复杂的多文件项目。
长上下文推理：支持 256k 上下文窗口，可在超大语料中保持连贯推理。
长周期执行：适应需要多步规划与持续交互的 Agent 任务。
前端设计：在 UI/UX 生成的美观度和实用性上均有提升。

此外，K2.6 已通过 Kimi.com、Kimi App、API 以及 Kimi Code 上线，支持文本、图片、视频多模态输入，并可同时开启思考与非思考模式、工具调用、JSON Mode 等功能。实际评测显示，K2.5 已在 tool-use 场景大幅投入，而 K2.6 则进一步巩固了这一方向，避免了“单纯刷分”的老路。

开发者迁移指南：如何快速拥抱K2.6

用户需在 2026 年 5 月 25 日前完成 API 调用更新，主要步骤如下：

修改 model 参数：将原先的 kimi-k2-0905-preview、kimi-k2-turbo-preview 等名称替换为 kimi-k2.6。
确认 endpoints：通过阿里云 DashScope、腾讯云 TokenHub 等平台调用时，需确保 base_url 与 HTTP 请求地址与 K2.6 兼容。例如，多模态模型需使用 multimodal-generation 端点（如 https://dashscope.aliyuncs.com/api/v1/services/aigc/multimodal-generation/generation），纯文本模型则用 text-generation 端点。
测试与验证：在开发环境中先完成回归测试，确保新模型在 agentic coding、推理、工具调用等核心场景的输出符合预期。
监控与备用：必要时保留 K2.6 的降级或回退方案，同时留意官方后续可能推出的更新版本（如 K2.6 以上的新模型）。

阿里云已在华北2（北京）、美国（弗吉尼亚）、德国（法兰克福）提供 Kimi 系列模型的兼容端点，腾讯云同样公布了详细的迁移指引。开发者只需修改 model 名称与调用参数，即可无缝获得更强的推理能力与持续支持。

Kimi K2 系列模型 API 官宣下线，将不再维护和支持

官宣下线：K2 系列定档2026年5月25日

从K2到K2.6：一次性能与功能的大幅跃升

开发者迁移指南：如何快速拥抱K2.6

链接失效反馈