中国信通院 6 月 16 日召开研讨会,启动高质量 Token 服务能力攀登计划

2025年我国公有云大模型对客侧Token调用量达到约2000万亿,相较2024年增长超16倍。大模型服务性能持续提升,根据中国信通院“公有云大模型Token服务性能监测”结果显示,截至2025年底平均调用成功率达99.9%,首Token时延由年初0.8秒降至0.6秒,每秒输出Token数从30个提升至50个。Token作为大模型最小处理单元,已演进为智能经济时代的核心计量单位,其规模化生产、流通和应用成为产业焦点。

中国信通院 6 月 16 日召开研讨会,启动高质量 Token 服务能力攀登计划

在此背景下,中国信通院将原有的“MaaS评估体系”全面升级为“Token服务评估体系”。新体系覆盖Token服务、MaaS平台和产品、管理与运营三大维度。重点新增Token服务能力评估,涵盖服务质量、服务性能、可观测性等方向,以及智能模型路由、智能原生CLI等工具能力;扩充模型运营管理评估,增加面向企业的智能体管理、模型运营、模型管理等成熟度能力;完善MaaS平台与应用评估,新增多模态MaaS及医疗等行业应用能力。该体系旨在面向平台厂商验证Token服务能力,面向MaaS厂商验证产品水平,面向应用方企业衡量内部AI运营成熟度。

中国信通院正式启动《基于Token计量的算力能力评价技术要求》标准研究工作。该标准面向大模型推理与服务场景,构建五大核心维度评价框架:一是Token使用效率,重点评测Output TPM、TTFT、Tokens/s、并发吞吐、缓存命中率、单卡Token输出速率等性能指标;二是投资回报率,聚焦算力投入与业务产出平衡;三是服务质量与稳定性,围绕端到端时延、报错率、可用性、并发稳定性、峰值承载、长时间运行波动率等指标;四是场景适配成熟度,评估通用Agent适配、结构化输出、业务场景覆盖度、模型切换灵活性等软性指标;五是平台运营治理成熟度,涵盖监控看板、日志审计、告警能力、限流熔断、多租户隔离、权限管理、多模型纳管等。标准现广泛征集大模型厂商、算力芯片/加速卡企业、云服务商、AI基础设施提供商及重点行业应用单位参与。

天翼云在会上展示了其全栈自主可控的一站式Token服务体系。依托息壤算力调度平台,天翼云构建了多芯适配、多模融合、智能路由的Token服务平台,并打造“中心-边缘-深边缘”三级协同推理网络,实现低时延、低成本Token供给。通过攻坚Token全链路优化技术,调度、推理、算子层面关键性能指标显著提升。同时,天翼云推出三大核心入口:AI云电脑作为智能体落地载体,息壤智云城市作为属地化门户一站式汇聚Token应用,魔乐社区作为国内最大国产化AI开源社区已汇聚超百万开发者、2.1万个模型。天翼云还启动“国云国芯国模·共创Token新生态”仪式,与智谱等伙伴完成全栈国产化闭环,推动Token服务在工业、政务、金融等行业的规模化落地。