8
第一代高性能
云端AI芯片

清微智能规模化量产的第一代高性能云端AI芯片,拥有高算力同时配备了超大容量显存,支持无交换机线性扩展,可灵活组建千卡级高速互连集群,旨在为智算中心提供大规模自主可控的国产算力支撑。

应用场景 大模型训练 长上下文推理

产品家族矩阵

清微智能围绕自研AI芯片,构建了覆盖AI计算模组、AI服务器、超节点等多种形态的全栈算力产品体系,
并搭配拥有自主知识产权的RAISA软件栈,为客户提供可满足各类应用场景需求的一站式AI算力解决方案。

8
REX 1032
高性能智算服务器

凭借强大算力及显存性能,REX1032服务器可支持单机部署DeepSeek R1 671B满血版,稳定支持128K长上下文推理,充分满足主流大模型本地化部署与高并发推理的核心需求。依托自研算力网格技术,在保障单节点高性能算力输出的同时,可实现跨机Mesh/Torus拓扑下的无交换机互连,支持千卡级别超大规模智算集群的高加速比线性扩展,有效支撑大模型预训练、视觉多模态处理、大规模云端推理等各类人工智能业务场景。

单机高密度算力
大显存容量

高显存带宽
高速互连带宽

低整机
功耗

云端集群
私有化一体机部署

8
TX81
计算模组
基于自研可重构2.0架构
支持多精度混合计算
大容量显存超高显存带宽
无交换机线性扩展
支持Mesh/Torus拓扑组建千卡级高速智算集群
兼容传统交换机组网架构
8
REX81
Supernode超节点

针对AI大模型发展中的算力瓶颈,清微智能推出可灵活重组的国产超节点系统REX81 Supernode,高效集成4096颗TX81芯片,算力突破每秒500千万亿次,显著降低互连成本,为全球算力竞争提供了兼顾高效与灵活的方案。入选2026中关村论坛重大科技成果。

超大显
存容量

超高
显存带宽

超高速
互连带宽

云端
集群部署

自研RAISA软件栈

RAISA软件栈兼顾了易用性、可编程性,且能充分发挥硬件性能,支持CUDA生态算子的平滑兼容;不仅适配了Pytorch、vLLM、
SGLang等国际主流AI框架,同时实现对FlagOS等国产生态框架的原生支持,满足主流大模型的快速适配和原生部署需求。

进化新一代 不止于更快

在显著强化混合精度算力的基础上,新一代采用了基于国产DRAM的三维存算融合技术,大幅提高显存带宽,并进一步增强
互连能力,旨在全面突破大模型训练与推理的性能瓶颈,达到国际先进水平。

大模型训练
高并发在线推理
低延迟智能体交互