5亿Tokens白送!全球首个商用AI主机发布,终于能放开烧Token了
联想百应AI主机首发:软硬服一体,打破企业算力壁垒
联想百应AI主机正式面世,成为全球首款面向商用的AI主机。该产品摒弃了传统算力中心的高成本与复杂部署,以“软硬服三位一体”的轻量化方案,让中小企业无需巨额投资即可快速搭建专属算力中枢。百应AI主机强调高适配性,能够灵活对接现有业务系统,并首次推出5亿Tokens免费赠送活动,大幅降低企业试错成本。这意味着,过去只有大厂才敢“烧Token”的推理训练,如今普通公司也能放手尝试。

算力需求指数级爆炸:从1200亿到120万亿Token的狂飙
火山引擎最新数据显示,豆包大模型日均Token使用量已突破120万亿,三个月前这一数字是60万亿,而2024年5月刚发布时仅为1200亿——两年实现了1000倍增长。英伟达CEO黄仁勋在GTC大会上指出,AI正从“感知”“生成”进化到“推理”与“行动”,这一阶段消耗的算力呈指数级攀升。企业对于高价值Token(如代码生成、逻辑推理)的需求激增,驱动整个产业必须寻找更高效、更低成本的算力供给方案。联想百应AI主机的推出,恰好踩准了这一爆发节点。
Vera Rubin架构革新:350倍Token生成速率提升
黄仁勋在GTC上展示了英伟达有史以来最复杂的AI计算系统Vera Rubin。该系统通过极致的端到端软硬件协同设计,在短短两年内将同一数据中心内的Token生成速率从2200万/秒提升至7亿/秒,增幅达350倍——同期摩尔定律仅能带来约1.5倍提升。核心突破包括:NVLink 72全互联架构、首款量产CPO光学交换机Spectrum X,以及100%液冷、无传统线缆的Kyber/Oberon机架。黄仁勋还建议,高吞吐场景可100%使用Vera Rubin,而高价值Token生成场景则可搭配25% Groq专用芯片,实现最优成本效益。
从SaaS到AaaS:每个公司都将变成智能体服务商
黄仁勋断言:“每一家SaaS公司都将转变为AaaS(Agent-as-a-Service,智能体即服务)公司。”为此,英伟达推出了企业级NeMo Claw参考设计,内置策略引擎与隐私路由器,确保智能体在访问敏感数据、执行代码时的安全落地。联想百应AI主机的发布,正是将这种AaaS能力下放到企业本地——不依赖云端,即可运行专属智能体。未来甚至有望突破地球限制:英伟达已宣布启动太空数据中心项目“Vera Rubin Space-1”,将AI计算延伸至宇宙深处,彻底打开Token消耗的想象空间。