谁在死磕,存算一体?
背景:后摩尔时代的算力困局
随着摩尔定律逐渐失效,芯片性能的提升越来越依赖架构创新而非单纯工艺微缩。而在大模型时代,参数规模从数十亿激增至数千亿,对存储带宽和容量的需求呈指数级上升。传统冯·诺依曼架构因计算与存储分离,频繁的数据搬运导致“存储墙”和“功耗墙”问题日益突出。
英伟达CEO黄仁勋曾直言,GPU中有70%的时间在等待数据,凸显了这一瓶颈的严重性。因此,存算一体(Compute-in-Memory, CIM)作为芯片架构的范式级创新,正被寄予厚望,被视为打破这一困局的关键路径。
技术路径:三种主要方案各有优劣
存算一体的技术路径主要包括以下三类:
- 近存计算(Near-Memory Computing, NMC):计算单元与存储单元通过先进封装(如HBM、3D堆叠)实现紧密集成,类似将仓库和工厂建在同一园区。
- 存内处理(Processing-in-Memory, PIM):在存储器外围电路中嵌入计算功能,相当于在仓库内设立初加工车间,部分运算可在存储端完成。
- 存内计算(Computing-in-Memory, CIM):直接利用存储介质的物理特性(如电阻、电荷、磁性)在存储阵列中执行计算,实现了真正的“存储即计算”。该方案能效比最高,但实现难度最大。
此外,不同存储介质的选择也影响技术路径:
- SRAM:读写速度快,兼容CMOS工艺,但存储密度低。
- DRAM:适合处理大容量模型,但与CMOS工艺兼容性差。
- Flash:非易失、低功耗,但读写速度受限。
- 新型忆阻器(如ReRAM、MRAM、PCM):具备良好的扩展性和能效,被认为是未来的理想介质,但目前良率和成熟度仍是挑战。
中国企业:多路并进,覆盖全场景
中国企业在存算一体领域展现出丰富多样的技术流派与应用布局,主要分为三类方向:
大算力、大模型方向
- 后摩智能:采用SRAM存算一体架构,自研第二代IPU架构“天璇”,实现浮点运算量产,推出国内首款存算一体智驾芯片鸿途H30,2025年第四季度将量产漫界M50芯片。
- 亿铸科技:走ReRAM路线,自主研发全数字存算一体芯片,积极引入RISC-V生态,计划2026年推出国产AI算力卡。
端侧、边缘AI方向
- 微纳核芯:基于CIM技术,融合3D近存计算和RISC-V异构架构,推出3D-CIM架构芯片,与兆易创新等企业合作推进生态建设,2025年已获得兆易创新入股。
- 炬芯科技:采用SRAM存内计算,推出AI音频芯片ATS323X、ATS362X,已实现量产,并应用于头部品牌无线麦克风和耳机。
- 知存科技:基于NOR Flash技术,推出WTM2101语音芯片,实现超过1000万颗出货量,广泛用于华为、小米等智能穿戴设备;新一代WTM-8系列支持AI视觉功能,算力达24TOPS,功耗仅市场同类方案的5%。
新型存储介质方向
- 昕原半导体:专注ReRAM技术研发,其28nm制程芯片已量产,是目前国内唯一实现ReRAM存算一体量产的企业。产品线包括ATOM系列,广泛应用于VR/AR等场景,曾获字节跳动投资。
商业化进展:已开始进入规模化落地阶段
尽管存算一体仍处于技术演进早期,但已在中国开始商业化落地:
- 炬芯科技:已实现端侧AI音频芯片的量产和出货,客户覆盖消费电子头部品牌。
- 知存科技:WTM2101语音芯片出货超千万颗,进入智能穿戴设备市场。
- 后摩智能:鸿途H30芯片2024年发布并通过车规认证,2025年量产,与联想、科大讯飞、中国移动等展开合作。
- 微纳核芯:与多家手机厂商和存储芯片厂商深度合作,牵头推动RISC-V存算一体标准制定。
- 亿铸科技:2023年完成原型芯片流片,计划2026年推出国产AI算力卡。
这些进展表明,存算一体在端侧、边缘、智驾等场景已具备实际商用能力,未来有望在数据中心和大模型训练中发挥更大作用。
未来展望:存算一体能否成为大模型的终极答案?
在大模型算力需求不断膨胀的背景下,存算一体技术的发展路径可分为三个阶段:
- 初期阶段:作为专用加速器,承担推理、预处理等特定任务,补充GPU万卡集群。
- 中期阶段:通过先进封装(如3D堆叠)与GPU深度融合,构建“近存+存内”的混合架构。
- 长期阶段:当新型非易失性存储介质(如ReRAM)成熟后,存算一体芯片有望成为算力集群的核心,实现“存储即计算”的全新架构体系。
尽管还面临良率、精度、通用性等挑战,存算一体已从实验室走向量产,逐步进入主流视野。其未来是否能成为大模型算力的终极答案,取决于技术演进、生态构建与市场需求的共同推进。
本文来自微信公众号“半导体产业纵横”(ID:ICViews),作者:九林,由36氪授权发布。