别盯着GPU了,英特尔甩出重磅大招,能否终结英伟达的算力垄断?
英特尔亮出“算力组合拳”:CPU+AI加速器双管齐下
过去两年,AI行业几乎被英伟达的GPU牢牢“焊死”在训练和推理场景中。从大模型训练到端云推理,谁能拿到更多H100、B200,谁就在算力竞赛中占据先机。但英特尔没有坐视不管,而是拿出了自己的“反制武器”——基于新一代至强处理器(代号Granite Rapids/Sierra Forest)和独立AI加速器Gaudi 3的组合方案。Gaudi 3专为大模型训练和推理设计,采用开放式架构和HBM内存,目标是在性能、成本和功耗上直接对标英伟达的产品。英特尔试图证明:算力竞争不只有GPU一条路,CPU+专用加速器的异构方案同样能扛起AI大旗。
大模型推理战场:英特尔凭什么挑战CUDA生态?
英伟达的护城河不只有硬件,CUDA软件生态才是让开发者难以转身的关键。英特尔则祭出oneAPI统一编程模型,试图降低迁移门槛。在推理场景中,英特尔强调其至强处理器内置的AMX(高级矩阵扩展)和AVX-512指令集,可以在不依赖独立GPU的情况下高效运行中小规模模型。对于已有大量x86服务器的企业,这意味着可以“原地升级”算力,无需花大价钱抢购英伟达GPU。英特尔还联合云厂商优化了PyTorch、TensorFlow等框架的英特尔后端,让模型在至强上跑出接近GPU的效果。如果这股风潮起来,英伟达在推理端的“包场”地位将首次出现松动。
数据中心“缺卡”焦虑下,英特尔能否成为平替选项?
当前整个行业因GPU短缺而备感焦虑,无论是超大规模云服务商还是中小创业公司,都在为“卡(GPU)”发愁。英特尔抓住这个窗口期,力推其AI加速器在性价比和供应稳定性上的优势。Gaudi 3在千卡级集群中的训练效率已接近H100的80%左右,但价格和功耗远低于后者。更重要的是,英特尔自家晶圆厂和台积电的双重产能保障,能够提供比英伟达更大的出货量。部分超算中心已开始大规模部署基于英特尔芯片的AI节点,试图摆脱对单一路径的依赖。这种“去风险”策略一旦被主流客户接受,英伟达的垄断铁幕就将出现第一道裂缝。
端侧和边缘AI:英特尔“守城”反攻的关键战线
在大模型普及的背景下,AI计算正从云端向边缘和终端设备扩散。英特尔在PC和物联网处理器上的积累,成为其挑战英伟达的另一张牌。新一代酷睿Ultra处理器集成了NPU(神经网络处理单元),可以在笔记本上直接运行70亿参数的大模型,无需联网和GPU。这直接瞄准了英伟达在边缘侧的薄弱环节——其GPU功耗和体积不适合移动端。如果未来数十亿台PC和工业物联网设备都搭载英特尔NPU,那么英伟达在数据中心之外的“算力王座”将面临根本性威胁。英特尔正在用自己的传统优势领域,倒逼出新的AI算力格局。
算力“三国杀”:未来赢家未必是GPU一家独大
从当前格局看,英伟达在AI训练市场的地位依然稳固,但英特尔的全栈式反击正在制造更多变数。一方面,云厂商和大型企业不喜欢被单一供应商锁定,他们会主动扶持英特尔、AMD等竞品;另一方面,AI模型本身也在演化——更高效的稀疏计算、混合精度训练以及推理专用芯片正在降低对通用GPU的依赖。英特尔的核心优势在于其CPU+GPU+NPU+FPGA的全面产品线,能够针对不同场景提供定制化方案。这场算力战争不会在短期内决出胜负,但可以确定的是:当英特尔不再“盯着GPU”,而是拿出整套生态方案时,英伟达的算力垄断时代终于迎来了真正的挑战者。