算苗3D TokenPU正式流片 引领国产AI云端大算力芯片再升级
全国产3D芯片首秀:A4E流片打破海外垄断
2026年6月15日,算苗科技宣布旗下面向大模型推理的3D TokenPU芯片A4E正式流片。这款芯片采用全国产3D混合堆叠工艺,从架构设计到流片制造全部依托国内产业链完成,标志着国内基于3D堆叠的AI推理芯片实现关键性国产突破。此前,高端3D算力方案长期由海外厂商主导,本土同类产品稀缺,A4E的流片补齐了国产AI算力硬件布局的关键短板,为大模型的高效推理提供了本土化硬件方案。

带宽飙至16TB/s,3D堆叠如何改写推理效率
A4E芯片的核心优势在于通过3D垂直堆叠技术,将存储芯片与计算芯片的集成密度提升一个数量级,实现高达16TB/s的极致带宽。与传统2D、2.5D芯片相比,3D架构大幅降低数据搬运损耗,显著提升大模型推理运行效率,适配通用大模型、多模态生成、实时对话等高负载场景。当前大模型推理的瓶颈并非计算本身,而是访存带宽——传统芯片在运行大模型时功耗高、速度受限,而3D TokenPU通过物理层面的创新直接解决了这一痛点。算苗科技规划中的下一代产品带宽将达到32TB/s,进一步拉大与现有方案的差距。
近10亿融资加持,硬核团队如何炼成
算苗科技的前身为声龙科技子公司,团队曾在声龙期间实现业界首个3D加密算力芯片的量产与商业化,累计出货超80万颗芯片并创收超12亿元。公司创始人汪福全博士、CTO刘明博士(前龙芯项目核心成员)及软件生态负责人楼建光博士(前微软研究院首席研究员)组成了精干的技术班底。2026年上半年,算苗科技在4个月内连续完成两轮近10亿元融资,由源码资本、石溪资本、襄禾资本及国开金融等机构领投。源码资本董事总经理张洵表示,算苗科技通过3D IC架构实现的高带宽、低成本方案,正是解决推理场景算力爆发式增长的关键,有望推动AI芯片从2.5D时代步入3D时代。
从芯片到生态:国产AI算力自主可控加速到来
A4E的流片不仅是单一芯片的突破,更意味着全国产3D IC产业生态的构建。算苗科技通过与国内供应链伙伴的深度磨合,摆脱了对先进工艺节点的绝对依赖,实现了“弯道超车”。汪福全博士指出,AI推理算力未来将像水电一样成为新型基础设施。随着大模型Token调用量的指数级增长(谷歌月均1300万亿Token、火山引擎日均50万亿Token),推理成本成为互联网巨头的核心竞争力。3D TokenPU正是针对这一痛点,以专用架构追求极致的单位Token成本优化,为国产大模型产业提供自主可控的高效算力底座。