清微智能

产品和技术
- 8系
- 5系
- 技术中心
- 端边协同
专业级边缘芯片
消费级边缘芯片
解决方案
关于清微

海纳澎湃算力于方寸
重构万物智能向云端

云边端大模型框架算法模型兼容性算力精度与重构优势

云边端大模型框架

算法模型兼容性

从端侧来看，清微智能边缘端量产芯片支持各类适配初筛场景的轻量 CNN 模型，其内置的可重构 AI 引擎可灵活兼容初筛所需的高召回率模型，满足端侧实时响应的核心需求。而在云端，清微智能基于可重构计算架构推出的 RPU 芯片单个模组，能够轻松承载千亿级参数的 VL 大模型（如已完成适配的 DeepSeek － R1 模型），为云端二次复核提供强大算力支撑，精准消除误报（如区分火焰与橙色干扰物、跌倒与正常躺卧）。

清微智能凭借其深厚的技术积淀，在算法支持层面与端云协同检测方案形成高度适配。方案中端侧轻量模型（如火焰检测、跌倒算法实时初筛）及云端视觉大模型（VL用于二次复核），均能在清微智能的芯片产品体系中高效运行。

算力精度与重构优势

算力精度匹配

方案中，端侧初筛对算力精度要求相对灵活，清微智能边缘端芯片支持 int4、int8、int16 等量化精度，可根据轻量模型需求灵活选择，在保证检测灵敏度的同时降低功耗。端到端性能对标国际一流厂商旗舰产品，能完美适配 VL 大模型的高精度计算需求。

可重构算力提升效率

清微智能核心的可重构计算技术（CGRA），通过将神经网络计算图拆解出的不同类型算子映射到计算阵列，构建灵活的硬件互联结构，形成可按需调配的算力资源。在端云协同方案中，这种重构能力可实现矩阵计算与向量计算模块的并行运作，同时支持计算与数据传输并行。例如，端侧芯片在处理初筛时，可通过可重构架构同步完成图像特征提取（向量计算）与目标初步识别（矩阵计算），大幅提升响应的稳定性；云端 TX81 芯片在进行二次复核时，并行算力可快速处理关键帧数据，缩短复核耗时，且能根据不同场景的风险等级，动态调整算力分配，适配复核阈值的变化。

成本、功耗与布局：适配场景需求的硬件优势

清微智能芯片通过技术创新实现成本控制，与方案 “优化成本” 的核心价值高度契合。从端侧来看智能视觉芯片系列已实现量产，规模化生产降低了硬件采购成本，且其可重构架构无需为不同初筛模型单独定制芯片，进一步减少硬件适配成本。在云端，清微智能 REX1032 训推一体服务器支持训推一体，不仅能满足 VL 大模型的推理需求，还可实现模型蒸馏训练，用户无需单独采购训练与推理设备，大幅降低硬件投入。同时，方案中 “大模型仅处理＜10％初筛样本” 的设计，结合清微智能芯片的高能效比，可减少云端算力消耗，降低长期运营成本（如电力、维护成本）。

结合清微智能技术特点后，端云协同火焰＆跌倒检测方案的优势得到进一步强化，具体对比数据如下：

海纳澎湃算力于方寸重构万物智能向云端

海纳澎湃算力于方寸重构万物智能向云端

云边端大模型框架

算法模型兼容性

算力精度与重构优势

算力精度匹配

可重构算力提升效率

图像更清晰，暗处更明亮

可重构算力提升效率

成本、功耗与布局：适配场景需求的硬件优势

海纳澎湃算力于方寸
重构万物智能向云端

海纳澎湃算力于方寸
重构万物智能向云端