5亿Tokens白送！全球首个商用AI主机发布，终于能放开烧Token了

1 个月前

AI资讯

23 阅读

算力 AI主机商用AI 联想百应

联想百应AI主机首发：软硬服一体，打破企业算力壁垒

联想百应AI主机正式面世，成为全球首款面向商用的AI主机。该产品摒弃了传统算力中心的高成本与复杂部署，以“软硬服三位一体”的轻量化方案，让中小企业无需巨额投资即可快速搭建专属算力中枢。百应AI主机强调高适配性，能够灵活对接现有业务系统，并首次推出5亿Tokens免费赠送活动，大幅降低企业试错成本。这意味着，过去只有大厂才敢“烧Token”的推理训练，如今普通公司也能放手尝试。

5亿Tokens白送！全球首个商用AI主机发布，终于能放开烧Token了

算力需求指数级爆炸：从1200亿到120万亿Token的狂飙

火山引擎最新数据显示，豆包大模型日均Token使用量已突破120万亿，三个月前这一数字是60万亿，而2024年5月刚发布时仅为1200亿——两年实现了1000倍增长。英伟达CEO黄仁勋在GTC大会上指出，AI正从“感知”“生成”进化到“推理”与“行动”，这一阶段消耗的算力呈指数级攀升。企业对于高价值Token（如代码生成、逻辑推理）的需求激增，驱动整个产业必须寻找更高效、更低成本的算力供给方案。联想百应AI主机的推出，恰好踩准了这一爆发节点。

Vera Rubin架构革新：350倍Token生成速率提升

黄仁勋在GTC上展示了英伟达有史以来最复杂的AI计算系统Vera Rubin。该系统通过极致的端到端软硬件协同设计，在短短两年内将同一数据中心内的Token生成速率从2200万/秒提升至7亿/秒，增幅达350倍——同期摩尔定律仅能带来约1.5倍提升。核心突破包括：NVLink 72全互联架构、首款量产CPO光学交换机Spectrum X，以及100%液冷、无传统线缆的Kyber/Oberon机架。黄仁勋还建议，高吞吐场景可100%使用Vera Rubin，而高价值Token生成场景则可搭配25% Groq专用芯片，实现最优成本效益。

从SaaS到AaaS：每个公司都将变成智能体服务商

黄仁勋断言：“每一家SaaS公司都将转变为AaaS（Agent-as-a-Service，智能体即服务）公司。”为此，英伟达推出了企业级NeMo Claw参考设计，内置策略引擎与隐私路由器，确保智能体在访问敏感数据、执行代码时的安全落地。联想百应AI主机的发布，正是将这种AaaS能力下放到企业本地——不依赖云端，即可运行专属智能体。未来甚至有望突破地球限制：英伟达已宣布启动太空数据中心项目“Vera Rubin Space-1”，将AI计算延伸至宇宙深处，彻底打开Token消耗的想象空间。

5亿Tokens白送！全球首个商用AI主机发布，终于能放开烧Token了

联想百应AI主机首发：软硬服一体，打破企业算力壁垒

算力需求指数级爆炸：从1200亿到120万亿Token的狂飙

Vera Rubin架构革新：350倍Token生成速率提升

从SaaS到AaaS：每个公司都将变成智能体服务商

链接失效反馈