中国信通院 6 月 16 日召开研讨会，启动高质量 Token 服务能力攀登计划

1 个月前

AI资讯

87 阅读

大模型 Token 中国信通院攀登计划

2025年我国公有云大模型对客侧Token调用量达到约2000万亿，相较2024年增长超16倍。大模型服务性能持续提升，根据中国信通院“公有云大模型Token服务性能监测”结果显示，截至2025年底平均调用成功率达99.9%，首Token时延由年初0.8秒降至0.6秒，每秒输出Token数从30个提升至50个。Token作为大模型最小处理单元，已演进为智能经济时代的核心计量单位，其规模化生产、流通和应用成为产业焦点。

中国信通院 6 月 16 日召开研讨会，启动高质量 Token 服务能力攀登计划

在此背景下，中国信通院将原有的“MaaS评估体系”全面升级为“Token服务评估体系”。新体系覆盖Token服务、MaaS平台和产品、管理与运营三大维度。重点新增Token服务能力评估，涵盖服务质量、服务性能、可观测性等方向，以及智能模型路由、智能原生CLI等工具能力；扩充模型运营管理评估，增加面向企业的智能体管理、模型运营、模型管理等成熟度能力；完善MaaS平台与应用评估，新增多模态MaaS及医疗等行业应用能力。该体系旨在面向平台厂商验证Token服务能力，面向MaaS厂商验证产品水平，面向应用方企业衡量内部AI运营成熟度。

中国信通院正式启动《基于Token计量的算力能力评价技术要求》标准研究工作。该标准面向大模型推理与服务场景，构建五大核心维度评价框架：一是Token使用效率，重点评测Output TPM、TTFT、Tokens/s、并发吞吐、缓存命中率、单卡Token输出速率等性能指标；二是投资回报率，聚焦算力投入与业务产出平衡；三是服务质量与稳定性，围绕端到端时延、报错率、可用性、并发稳定性、峰值承载、长时间运行波动率等指标；四是场景适配成熟度，评估通用Agent适配、结构化输出、业务场景覆盖度、模型切换灵活性等软性指标；五是平台运营治理成熟度，涵盖监控看板、日志审计、告警能力、限流熔断、多租户隔离、权限管理、多模型纳管等。标准现广泛征集大模型厂商、算力芯片/加速卡企业、云服务商、AI基础设施提供商及重点行业应用单位参与。

天翼云在会上展示了其全栈自主可控的一站式Token服务体系。依托息壤算力调度平台，天翼云构建了多芯适配、多模融合、智能路由的Token服务平台，并打造“中心-边缘-深边缘”三级协同推理网络，实现低时延、低成本Token供给。通过攻坚Token全链路优化技术，调度、推理、算子层面关键性能指标显著提升。同时，天翼云推出三大核心入口：AI云电脑作为智能体落地载体，息壤智云城市作为属地化门户一站式汇聚Token应用，魔乐社区作为国内最大国产化AI开源社区已汇聚超百万开发者、2.1万个模型。天翼云还启动“国云国芯国模·共创Token新生态”仪式，与智谱等伙伴完成全栈国产化闭环，推动Token服务在工业、政务、金融等行业的规模化落地。

中国信通院 6 月 16 日召开研讨会，启动高质量 Token 服务能力攀登计划

链接失效反馈