华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”

全新范式出炉:Agentic Infra如何定义智能时代新底座?

华为云在本次发布会上正式提出Agentic Infra新范式,其核心理念可概括为“高效Token工厂+持续学习+通智一体化调度+安全自治”。这一范式旨在为Agentic AI提供从算力、存储、调度到运行环境的全栈式基础设施支撑,让智能体不仅跑得快,还能学得深、管得稳。围绕这一范式,华为云一口气发布了四款核心产品,分别从算力集群、记忆存储、混合调度和运行安全四个维度重新定义了AI基础设施的能力边界。

十倍效率:AICS灵衢智算集群打造极致Token工厂

作为“Token工厂”的核心引擎,AICS灵衢智算集群基于超大带宽的灵衢网络,支持10万卡级集群规模,总算力达到惊人的200EFLOPS。在性能指标上,它将Token生成时延压缩至10毫秒以内,千卡每秒吞吐量达到500万Tokens,在线服务可用性高达99.95%。这套集群以极低延迟和极高吞吐,让大模型推理和训练的效率实现量级跃升,为企业处理海量Token请求提供了坚实底座。

华为云发布Agentic AI系列新品 打造智能时代“硅基黑土地”

记忆破壁:AMS与CCE Volcano Next让Agent持续学习、算力无忧

Agent的长期记忆和持续学习能力常常受限于存储与调度瓶颈。华为云发布的AMS Agentic记忆存储解决方案,通过NPU直通CMS(上下文记忆存储)硬件,打造了PB级超大记忆空间,并支持KV Cache分层池化,不仅大幅降低了推理成本,还使得天级长程任务成为可能,真正打破了Agent的记忆瓶颈。同时,CCE Volcano Next通智一体化调度引擎通过“训推共池+碎片整合”实现通智混合算力负载的革新调度,可将资源利用率提升30%以上,让AI算力不再闲置浪费。

安全自治与模型进化:AgentSphere与ModelArts Next双轮驱动

在运行环境安全层面,AgentSphere提供了安全自治的Agent运行底座,凭借羽量级沙箱技术实现100毫秒级极速启动与每分钟十万级批创能力,并具备意图主动防护功能,助力智能体安全、高效地规模化上云。而在模型训练与推理层面,ModelArts Next模型训推平台构建了RL强化学习服务、机密推理、模型路由、模型矩阵四大核心能力。其中MaaS模型路由支持成本优先、效果优先、均衡模式三种策略,可根据请求特征动态智能择优调度最佳模型。截至目前,该平台已提供15余款SOTA模型服务,模型调度精准率超过95%,调用成本平均降低20%。企业级RLaaS服务更让强化学习成为每个企业都能调用的核心能力,实现一分钟创建任务、全程可视化观测、训推一致性保障,助力大模型越用越聪明。

生态落地:行业AI梦工厂四大专区与百模千态合作计划

会上,华为云宣布正式上线“行业AI梦工厂”,率先布局智慧医疗、具身智能、智能制造、科学计算四大专区。其中智慧医疗专区已有20余家医院入驻,实现病理方案全国规模复制;具身智能专区发布了全球首个全流程具身智能开发平台CloudRobo,帮助机器人小时级上云、模型分钟级部署;智能制造专区与科学计算专区则分别聚焦工业智能体创新和AI4S科研创新。此外,华为云联合智谱、DeepSeek、Minimax、Kimi、阶跃星辰、百度、讯飞星火等20余家TOP模型厂商,共同发布“百模千态,云聚共赢”生态合作计划,旨在共建系统化商业生态,打造多方共赢的产业发展新模式。与此同时,全新Agentic华为云入口“智果园”也同步上线,将全栈Agentic云服务、丰富智能体与百模千态大模型一体化聚合,为用户提供按需、高效的Tokens服务与全新交互体验。