算苗科技 3D TokenPU 芯片 A4E 流片成功:国产大模型推理算力新突破
2026-06-19 10:30:00
算苗科技 于 6 月 19 日 宣布 3D TokenPU 芯片 A4E 完成 流片——国产 3D 混合堆叠 AI 推理芯片 重要节点。
技术亮点
| 维度 | 说明 |
|---|---|
| 3D 混合堆叠 | 垂直堆叠提升带宽与算力密度 |
| Tile-Native | 硬件原生 Tile 调度 + 多精度动态切换 |
| 软件栈 | 适配 LLVM、Triton 等开源生态 |
| 目标场景 | 大模型 Token 推理(一次搬运、多次复用) |
产业意义
- 中国 首次 基于 国产供应链 的 3D 堆叠 AI 芯片量产路径
- 降低大模型推理 TCO(总拥有成本)
- 与 昇腾、平头哥 等形成 多元国产算力 供给
资本
投资方包括 国开金融、北京顺禧、源码资本 等——涵盖国资、市场化基金、产业资本。
对软件行业
- 私有化部署 DeepSeek/Qwen/GLM 的 推理成本 有望下降
- 云厂商、政企 信创算力 多一个 架构创新选项
- 需关注 量产进度、框架适配、Benchmark 公开数据
趋势
2026 年国产 AI 竞争从 「堆参数」 转向 「架构创新 + 供应链自主」。