清微智能规模化量产的第一代高性能云端AI芯片,拥有高算力同时配备了超大容量显存,支持无交换机线性扩展,可灵活组建千卡级高速互连集群,旨在为智算中心提供大规模自主可控的国产算力支撑。
应用场景 大模型训练 长上下文推理
清微智能围绕自研AI芯片,构建了覆盖AI计算模组、AI服务器、超节点等多种形态的全栈算力产品体系,
并搭配拥有自主知识产权的RAISA软件栈,为客户提供可满足各类应用场景需求的一站式AI算力解决方案。

凭借强大算力及显存性能,REX1032服务器可支持单机部署DeepSeek R1 671B满血版,稳定支持128K长上下文推理,充分满足主流大模型本地化部署与高并发推理的核心需求。依托自研算力网格技术,在保障单节点高性能算力输出的同时,可实现跨机Mesh/Torus拓扑下的无交换机互连,支持千卡级别超大规模智算集群的高加速比线性扩展,有效支撑大模型预训练、视觉多模态处理、大规模云端推理等各类人工智能业务场景。
单机高密度算力
大显存容量
高显存带宽
高速互连带宽
低整机
功耗
云端集群
私有化一体机部署



针对AI大模型发展中的算力瓶颈,清微智能推出可灵活重组的国产超节点系统REX81 Supernode,高效集成4096颗TX81芯片,算力突破每秒500千万亿次,显著降低互连成本,为全球算力竞争提供了兼顾高效与灵活的方案。入选2026中关村论坛重大科技成果。
超大显
存容量
超高
显存带宽
超高速
互连带宽
云端
集群部署

RAISA软件栈兼顾了易用性、可编程性,且能充分发挥硬件性能,支持CUDA生态算子的平滑兼容;不仅适配了Pytorch、vLLM、
SGLang等国际主流AI框架,同时实现对FlagOS等国产生态框架的原生支持,满足主流大模型的快速适配和原生部署需求。

适配行业应用及生态框架,
主要包括各行业Agent及模型应用,主流训练与推理框架

支持应用层适配,提供自研C/C++接口语言且支持通用Triton编程语言,
提供自研高性能算子库,支撑客户快速迁移应用。

根据上层需求对计算图进行全局优化,
实现上层应用与硬件的高性能对接。

提供完整配套工具和开发套件,涵盖驱动、
容器、虚拟化及配套开发者工具链。
在显著强化混合精度算力的基础上,新一代采用了基于国产DRAM的三维存算融合技术,大幅提高显存带宽,并进一步增强
互连能力,旨在全面突破大模型训练与推理的性能瓶颈,达到国际先进水平。
