视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片

精准聚焦视觉任务:Pinterest 为何选择 Trainium?

Pinterest 平台每天处理数十亿张图片的识别、分类与推荐,对 AI 训练和推理芯片的并行计算能力要求极高。亚马逊 AWS Trainium 芯片专为大模型训练场景设计,在大规模矩阵运算、混合精度计算及分布式训练上进行了专门优化,其定制互联架构可支持数千枚芯片协同运行。相比英伟达 GPU,Trainium 能将 AI 模型训练和运营成本降低高达 50%,能耗降低 40%,这对于追求成本效益的 Pinterest 而言极具吸引力。

视觉内容社交平台 Pinterest 为 AI 服务导入亚马逊 AWS Trainium 芯片

AI 巨头已验证:OpenAI、Anthropic 的算力军备竞赛

Trainium 并非孤军奋战,其商业可行性已获行业头部客户背书。OpenAI 宣布将原本 7 年期 380 亿美元的算力交易扩展至 8 年期 1000 亿美元,承诺通过 AWS 基础设施消耗约 2 GW 的 Trainium 算力容量,涵盖 Trainium 3 及预计 2027 年开始交付的 Trainium 4。Anthropic 同样深度绑定 Trainium,AWS 已为其在印第安纳州、密西西比州和宾夕法尼亚州的数据中心集群化部署 50 多万颗芯片,并计划年底前配置 100 万颗。这种规模化的成功部署,为 Pinterest 等视觉平台提供了坚实的技术验证。

性能与成本的博弈:Trainium 3 的“极速迭代”与争议

Trainium 3 于 2025 年 12 月正式向客户开放,单服务器含 144 颗芯片,计算性能较前代提升四倍以上,能耗降低 40%。亚马逊 CEO 安迪·杰西表示,Trainium 3 的性价比比 Trainium 2 提升约 40%,预计到 2026 年年中几乎所有可用供应都将被预订一空。然而,市场也曾传出性能不及预期的传言,称其生成 AI token 成本可能高于同类芯片。但供应链高管否认减产计划,反而在积极准备从 2026 年第二季度起大幅增产,散热和服务器厂商均看好 ASIC 芯片将成为下半年重要增长动力。

生态短板与突围:兼容 NVLink 的下一代 Trainium 4

Trainium 目前的一大短板是缺乏英伟达积累多年的软件生态库。有客户反映,在开发挖掘机导航模型时仍选择英伟达芯片。为弥补这一缺陷,亚马逊已着手开发 Trainium 4,其标准 AI 工作负载性能将达到 Trainium 3 的三倍以上。更关键的是,Trainium 4 将采用英伟达的 NVLink Fusion 高速芯片互连技术,实现与英伟达服务器和硬件的协同工作。此举意味着亚马逊在竞争的同时,主动借助对手的生态优势吸引包括 Pinterest 在内的主流 AI 客户。

定制芯片浪潮:ASIC 如何改写 AI 硬件版图?

高端 AI ASIC 加速器出货量预计 2025 年达 513 万台,2026 年达 723 万台,年增速超过 40%,远超增速仅 20% 出头的 GPU。AWS 高管透露,其定制芯片业务(含 Trainium 和 Graviton)年收入已超 100 亿美元。Pinterest 等视觉内容平台的加入,正是这场从通用 GPU 向专用 ASIC 迁移浪潮的缩影。随着 ASIC 在特定负载的性价比优势持续凸显,AI 基础设施的格局正在被重新书写。