起猛了!Arm推出首个自研CPU,黄仁勋贴大脸发言
在人工智能浪潮推动芯片行业经历前所未有的变革之际,Arm Holdings正式发布了其首款英特尔风格的自研电脑芯片——Compute Subsystems(CSS),这一举措标志着这家IP授权巨头首次踏入成品芯片销售领域。与此同时,英伟达CEO黄仁勋近期对AI行业泡沫风险的质疑,与Arm CEO雷内·哈斯(Rene Haas)的观点形成了鲜明对比,后者认为行业远未达到临界点。
商业模式的重大转向:Arm的自研芯片之路
Arm公司长久以来一直坚持其核心商业模式,即向苹果、高通、英伟达等数千家公司授权芯片架构设计,自身并不参与成品芯片的制造与销售。此次Compute Subsystems的发布,意味着Arm在商业模式上做出了重大调整。这款自研芯片不仅集成了Arm自家的CPU核心,还整合了图形处理单元(GPU)、内存控制器、互连技术等周边组件,形成了一套完整的系统级芯片(SoC)解决方案,旨在加速客户产品的上市进程。
对于为何打破传统,哈斯解释称,这是为了向合作伙伴展示Arm架构所能达到的极致性能与能效,并为他们提供一个更稳固的参考设计平台,从而吸引更多客户在其技术基础上进行研发。然而,这一举动也让Arm与部分长期客户的关系变得微妙,特别是那些同样在开发高性能计算芯片的公司。尽管Arm强调其自研芯片主要作为技术展示和验证平台,销售规模不会很大,但市场仍担忧其是否会与客户形成直接竞争。
黄仁勋的警示与行业的“泡沫”辩论
在Arm积极拓展业务边界的同时,英伟达的掌舵人黄仁勋却发出了截然不同的声音。他在近期的公开活动中对AI行业投资热提出了警告,用极其直接的方式表示:“我认为泡沫已经存在了。”这一言论的背后,是基于他对当前市场状态的观察:大量资金涌入AI基础设施建设,而实际的应用回报、技术成熟度以及所需的专家人才储备可能远未跟上资本的步伐。
黄仁勋的判断依据包括:
- 投资回报不确定性:许多企业投入巨资购买昂贵的GPU和建设数据中心,试图复刻GPT等成功案例,但往往因内部数据质量、缺乏顶尖AI人才(如苏茨克弗级别的人物)而陷入困境,导致项目沦为“空头软件”或昂贵的“玩具”。
- 能源消耗与实际收益:AI模型训练和推理的功耗呈指数级增长,英伟达最新的B200芯片功耗已达1000瓦,单个机架的耗电量相当于上百个美国家庭。与此同时,谷歌、微软等科技巨头的碳排放量因AI业务而激增,与其碳中和承诺背道而驰。这种高投入、高能耗的现状,让市场对AI商业化的可持续性产生质疑。
- 市场过热信号:全球知名对冲基金艾略特管理公司(Elliott Management)也指出,AI被过度炒作,许多应用尚未准备好进入“黄金时段”,科技股特别是英伟达已陷入“泡沫状态”。
然而,Arm CEO雷内·哈斯对此持不同意见。他认为,尽管AI领域可能存在一些过热现象,但整个行业远未达到临界点。哈斯强调,对计算能力的需求是“无止境的”,无论是云端还是边缘侧,新模型和应用的涌现仍在不断推高对底层硬件的需求。他以历史进程作比,称我们仍处于AI发展的非常早期阶段。
四面楚歌:英伟达帝国的“围猎战”
黄仁勋的泡沫警告,或许也折射出英伟达面临的日益激烈的竞争压力。当前的芯片市场正在上演一场针对英伟达的“围猎”行动,曾经的客户与对手正从多个方向发起挑战。
- 大客户“倒戈”与自研浪潮:谷歌、亚马逊、微软、Meta等超大规模云服务商正加速自研AI芯片的步伐。谷歌的第七代TPU Ironwood性能已比肩甚至在某些指标上超越英伟达B200,且能效更优;Meta已大规模部署自研MTIA芯片,旨在摆脱对英伟达高昂毛利的依赖。这些巨头不愿重蹈当年被英特尔“卡脖子”的覆辙,更希望掌握核心算力的主动权。
- 定制芯片(ASIC)的围剿:以博通(Broadcom)为代表的定制芯片阵营强势崛起。博通不仅为谷歌、Meta设计TPU和MTIA,还拿下了OpenAI即将推出的自研芯片Titan的大单。博通CEO陈福阳指出,在推理任务上,ASIC的成本可比GPU低30%至50%。凭借其在定制化领域的优势,博通正切走英伟达版图中的重要一块。
- 传统对手的反击:AMD的MI300X已成功打入微软、OpenAI、甲骨文的供应链,其新一代产品在推理性能上号称有数十倍提升;英特尔则以低价、低功耗的Gaudi 3加速器试图在市场中分一杯羹,并获得了戴尔等厂商的支持。
- 新秀的突袭:Groq、Cerebras等初创公司专注于推理赛道,宣称其芯片速度更快、成本更低。特别是Cerebras,其晶圆级芯片设计和与OpenAI的大额订单,显示了在细分领域挑战巨头的实力。英伟达甚至不得不以170亿美元的高价买下Groq的技术授权和核心团队,以消除潜在威胁。
技术瓶颈与未来的不确定性
在这场激烈的竞争中,技术瓶颈也逐渐显现,成为行业发展的“暗礁”。
- CPU的复兴与瓶颈:随着智能体AI(Agentic AI)的兴起,需要大量“编排”和调度的CPU工作负载变得愈发重要。英伟达也承认CPU正成为扩展AI工作流的瓶颈,并已推出Grace CPU。然而,市场对CPU的需求激增导致供应紧张,交付周期延长,价格飙升。
- “电力墙”挑战:数据中心的供电能力正成为AI发展的硬约束。英伟达GB200机架高达120千瓦的功耗,远超绝大多数数据中心的承载能力。全球仅有不到5%的数据中心能支持单机架50千瓦以上的功率密度。高盛预测,到2030年全球数据中心电力需求将增长165%,电网并网审批周期长达数年。这意味着,即便芯片订单再多,物理世界的供电能力也将限制实际部署规模,而这恰恰给了低功耗替代方案(如谷歌TPU、英特尔Gaudi)可乘之机。
综上所述,Arm的入局、竞争对手的围攻、以及黄仁勋对泡沫的警示,共同勾勒出AI芯片行业在2025-2026年的复杂图景。尽管CUDA生态壁垒依然深厚,英伟达在训练领域地位稳固,但未来的市场格局预计将走向分化:英伟达继续领跑训练与高性能计算,而推理和定制化市场将被博通及其他厂商瓜分。在这场技术与商业的博弈中,谁能解决功耗难题并提供更具成本效益的方案,谁就将掌握下一轮竞争的主动权。