清微智能 Tsingmicro

版本: v4.0 最后更新: 2026年3月19日 核心标签: 非GPU架构可重构芯片边云一体国产替代反共识硅设计

产品概览

清微智能是国内”非GPU新型架构AI芯片”的反共识代表。脱胎于清华大学微电子所Thinker团队（2018年成立），聚焦可重构计算芯片——本质上是用架构创新来穿透GPU的通用-专用二元对立。

核心反共识价值：不走GPU通用路线，也不做TPU专用路线，而是基于CGRA（粗粒度可重构阵列）架构，做”通用型TPU”——既保留GPU的灵活性，又趋近TPU的能效优势。这是PC时代CPU-GPU分化后，AI时代芯片架构的又一次创新分化。

财务位置：C轮融资超20亿RMB（2025年12月完成），由北京市属国企京能集团领投，已启动上市筹备。累计出货2000万颗芯片，算力卡订单近2万张。

核心差异

1. 架构选择：CGRA vs GPU vs TPU

维度	GPU	TPU	CGRA（清微）
架构特性	通用流处理	专用张量运算	可重构数据流
能效比	基准	3-5倍优势	趋近3-5倍
灵活性	高	低	中高
算力卡成本	高	低	中
应用适配	多模态广泛	特定模型	端侧+边缘+云侧

本质洞察：CGRA不是GPU的削弱版，而是非冯·诺依曼架构的实施——软件管道动态重构硬件电路，实现”应用即芯片”的状态。距钱距离上，这个方向更靠近实际部署的异质性需求。

2. 可重构计算的反脆弱性

传统ASIC一旦流片固定，无法迭代。GPU虽灵活但功耗不经济。清微的可重构架构具有：

实时适应：同一套硬件，根据算法/应用需求改变功能电路
模型兼容：混精度计算（1-bit～16-bit），单一芯片支持多种精度和算法
非神经网络优化：既能跑深度学习，也能高效执行特征工程、信号处理等非NN逻辑
成本递减：不需为每个新算法或精度重新设计芯片

这在AI模型快速迭代的当下，构成了选择权最大化的系统设计。

3. 产业分层视角

清微切入的是端侧→边缘→云侧的完整计算链：

端侧（TX2系列）：语音AI SoC，工作功耗<2mW，VAD<100μW，延时<10ms。全球首款可重构超低功耗语音AI芯片TX210已规模化量产
边缘（TX5系列）：多模态智能芯片，支持目标识别、人脸识别、3D视觉，能效比达国际同类3-5倍
云侧（TX8系列）：高算力芯片，基于可重构数据流架构，通过Mesh网络和TSM-Link实现芯片间和服务器间互联

这是对标GPU厂商垂直整合思路，但用新架构重新定义了端-边-云的能效分界线。

产品矩阵

TX2系列：端侧语音芯片

TX210（已量产）

工作功耗：<2mW（业界最低）
语音活动检测(VAD)：<100μW
延时：<10ms
应用：智能耳机、助听器、IoT设备、边界唤醒
商业成就：已规模化量产，累计出货突破千万级

反共识价值：全球首款可重构语音AI芯片。传统方案多为固定ASIC，清微用可重构架构实现了低功耗+高灵活的统一。

TX5系列：边缘多模态芯片

TX510及后续

多模态支持：视觉、语音、传感器融合
算法覆盖：目标识别、人脸识别、3D视觉、行为识别
能效比：3-5倍于国际同类产品
部署场景：智能安防、工业检测、自动驾驶感知前端

商业意义：边缘AI硬件的下一代。做到了同一芯片支持多种算法的动态切换，避免了为不同应用设计不同ASIC的成本爆炸。

TX8系列：云侧算力卡

架构亮点

可重构数据流设计
Mesh网络互联
TSM-Link跨芯片通信协议
服务器级集成

市场位置：对标英伟达H100/H200，但采用非GPU架构。瞄准智算中心、AI训练推理的新选择。已在全国十余座千卡规模智算中心落地。

成本结构：算力卡订单累计近2万张，表明云侧落地的商业可行性。

技术深度

可重构计算架构（Reconfigurable Computing）

核心机制：

算法映射为数据流图（DFG）
数据流图动态配置到粗粒度可重构阵列(CGRA)
形成特定计算电路，执行完成后可重配置
接近ASIC效率，同时保留软件灵活性

对比固定架构：

ASIC：一旦流片不可更改，算法创新成本极高
GPU：通用但功耗/能效不经济
CGRA：在软硬边界上找到平衡点

混精度与动态精度切换

清微芯片支持1-bit～16-bit混精度计算：

同一模型不同层用不同精度
实时动态切换，无需重新编译
减少存储和计算成本，特别对量化模型友好

非神经网络优化

区别于纯深度学习芯片，清微支持：

特征工程计算
信号处理（DSP工作负载）
图算法
传统机器学习推理

这在实际部署中很关键——很多应用是NN+传统算法的混合，单纯的深度学习芯片反而会成为瓶颈。

商业版图

融资与估值

阶段	时间	金额	领投方	估值信号
天使轮	~2019	亿级RMB	-	种子期
B轮	~2021-2022	数亿RMB	-	早期成长
C轮	2025年12月	>20亿RMB	京能集团、北创投、建投投资	Pre-IPO估值

融资逻辑：从清华Thinker团队的技术积累→芯片量产能力→云侧规模落地→上市筹备，遵循硬件创业的标准加速路径。

市场位置

距钱距离：从近到远排序

端侧量产阶段：TX2系列已规模化量产（千万级出货），直接产生营收
边缘规模化：TX5在安防、工业检测等垂直领域的客户化部署
云侧商业化：TX8在智算中心的万张级订单，成为PCIe算力卡的新选择
生态建设：工具链、编译器、开发者社区的投入

反共识优势：市场还在关注GPU卷价格战时，清微用新架构开辟了”非GPU”赛道。如果云侧规模化成立，这不是GPU的补充，而是替代级的竞争。

出货与部署

累计出货：2000万颗芯片（端侧+边缘为主）
算力卡订单：近2万张（云侧增长信号）
智算中心：十余座千卡规模中心实现落地
生态客户：安防、工业、IoT、医疗等垂直领域

战略思考

1. 反共识的硅设计哲学

主流认知：GPU通吃AI芯片市场。

清微认知：GPU是通用但不经济，AI芯片最终走向异质化——端侧、边缘、云侧各有最优架构。CGRA是这个异质化竞争中最具通用性的新架构。

类比参考：PC时代，CPU垄断→GPU崛起→FPGA小众→最后稳定为CPU主导+GPU加速+特定领域ASIC。AI芯片目前处于GPU垄断期，3-5年后极有可能出现新的分化。

2. 系统设计优于个体努力

不是争夺GPU市场的残羹冷炙，而是从架构层设计全新的竞争维度：

端侧用功耗定义优势
边缘用能效定义优势
云侧用成本-性能比定义优势

一套可重构架构贯穿三层，形成系统级竞争力。

3. 选择权最大化

可重构芯片本质上给用户更多选择权：

算法迭代时可重配置，不用换芯片
精度需求变化时可动态调整
应用场景混合时可适配多种工作负载

这符合”祝时时有选择，路路有回转”的设计哲学。

4. 上市预期与国产替代

已启动上市筹备，目标是国内”非GPU新型架构”首个上市标杆。这一步如果成立，意味着：

验证了市场和商业模式的可行性
国内有了GPU之外的芯片设计方向
类似方向的创企获得融资和人才吸引力

竞争格局

直接竞争者

竞品	架构	定位	优势	劣势
英伟达GPU	流处理	通用AI芯片	软件生态、市场份额	功耗、成本
Google TPU	张量运算	专用深度学习	能效、成本（Google内部）	灵活性差
昆仑芯/寒武纪	自研架构	国产替代	政策支持	生态建设中
清微CGRA	可重构数据流	端边云一体	灵活性+能效平衡	生态成熟度

清微的位置

不是GPU的削弱版，而是一个新的架构路径。成功的关键是：

云侧规模化：TX8能否在智算中心成为PCIe标配
生态成熟：编译器、开发框架、应用优化的完善程度
成本优势：单位算力成本是否低于GPU
市场教育：能否改变用户”非GPU即次选”的认知

发展阶段判断

当前阶段：端侧验证+边缘商业化+云侧初期

端侧（已完成）：TX2系列规模化量产，商业模式跑通
边缘（进行中）：TX5在垂直领域的客户化落地
云侧（初期）：TX8在智算中心的规模化刚刚开始

下一阶段（2026-2027）：云侧规模化

关键指标：

智算中心装机数量（从十几个→100+）
单个数据中心算力卡规模（从千张→万张）
单位算力成本与GPU的成本差

远期目标：生态主权

不止芯片本身，还要建立：

自主编译器和开发工具链
应用优化方法论
开发者社区和生态标准

这是否能成立，决定了清微能否从”芯片供应商”升级为”计算架构定义者”。

投资逻辑

看好的理由

架构创新的正确方向：可重构计算是学术界公认的下一代方向，清微走在前面
商业验证：从端侧量产→边缘部署→云侧订单，逐层验证商业化可行性
融资节奏：C轮超20亿，投资方包括政府产业基金+头部创投，说明市场信心
国产替代红利：政策支持+芯片自主需求，给了新架构试错的空间
离钱最近：端侧已盈利，边缘快速增长，云侧初期但势头良好

风险点

生态建设成本：CGRA开发难度高于GPU，吸引开发者的成本大
云侧突破不确定：能否真正替代GPU，而不仅是补充，是关键赌注
巨头进入：如果高通、AMD或国内厂商跟进CGRA方向，竞争激烈
技术路线风险：如果量子计算、神经形态芯片等突破性技术出现，CGRA可能变成过渡方案
融资压力：硬件企业烧钱快，上市之前融资不能断

三年展望

乐观情景：新架构成为行业标准

2026年：云侧规模扩大到100+智算中心，算力卡年度出货10万张
2027年：上市成功，估值200-300亿RMB，成为国内”非GPU”首个上市公司
2028年：CGRA生态基本完善，与GPU分庭抗礼

此时清微不再是”替代品”，而是”新赛道的定义者”。

现实情景：云侧增长但被GPU蚕食

2026年：云侧规模化缓慢，主要还是端侧+边缘营收
2027年：上市融资，继续加强云侧推广和生态建设
2028年：成为AI芯片的”第二梯队”，有稳定市场但难以挑战GPU

此时清微的价值在于”可靠的替代选择”而非”新的主流”。

悲观情景：云侧难以突破

GPU继续降价和优化，单位算力成本逼近CGRA
生态建设遇冷，开发者留在GPU生态
云侧订单增长停滞，清微沦为边缘玩家

数据点汇总

指标	数据	时间
成立年份	2018年	-
来源	清华大学微电子所Thinker团队	-
C轮融资	超20亿RMB	2025年12月
累计出货	2000万颗芯片	2025年末
算力卡订单	近2万张	2025年末
智算中心部署	十余座千卡规模中心	2025年末
TX210功耗	<2mW（工作）、<100μW（VAD）	量产
TX510能效	3-5倍于国际同类	规格
主要融资方	京能集团、北创投、建投投资、武岳峰科创	C轮

关键问题

CGRA能否规模化？关键在于编译器成熟度和开发者学习成本
云侧成本优势是否可持续？取决于良率、产能和制程的进展
生态谁来建？清微自己还是联合产业链上下游
政策支持的边界在哪？国产替代红利能撑多久
上市后的增长故事是什么？云侧规模化还是新的产品线

总结

清微智能是反共识芯片设计的代表。不走GPU或TPU的既有路线，而是用可重构计算架构开辟新的竞争维度——这本身就符合”非共识才是真机会”的投资逻辑。

从端侧量产→边缘商业化→云侧初期的逐层递进，从天使轮亿级到C轮20亿的融资加速，从2000万出货到智算中心规模落地，每一步都在验证商业模式的可行性。

关键赌注在云侧规模化。如果TX8能在智算中心成为PCIe算力卡的新标配，那就不是”替代品”而是”新选择”；如果只能做到垂直领域应用，那就是一个聚焦的细分市场参与者。

距钱距离判断：当前最靠近钱的是端侧（已盈利），次之是边缘（快速增长），云侧还在初期但增长势头明显。如果融资不断，这个方向有足够的跑道走到上市。

三年内最核心的看点：2026年智算中心部署数量和单个中心的算力卡规模。这两个指标能说明云侧突破是否成立。

网络导航

同赛道 → Cohere、Mistral AI、Pinecone、Replicate、Scale AI、Together AI
探索行业 → 基础设施赛道全部产品

Mars Product Wiki

探索

清微智能