
算力精度匹配
方案中,端侧初筛对算力精度要求相对灵活,清微智能边缘端芯片支持 int4、int8、int16 等量化精度,可根据轻量模型需求灵活选择,在保证检测灵敏度的同时降低功耗。端到端性能对标国际一流厂商旗舰产品,能完美适配 VL 大模型的高精度计算需求。 可重构算力提升效率
清微智能核心的可重构计算技术(CGRA),通过将神经网络计算图拆解出的不同类型算子映射到计算阵列,构建灵活的硬件互联结构,形成可按需调配的算力资源。在端云协同方案中,这种重构能力可实现矩阵计算与向量计算模块的并行运作,同时支持计算与数据传输并行。例如,端侧芯片在处理初筛时,可通过可重构架构同步完成图像特征提取(向量计算)与目标初步识别(矩阵计算),大幅提升 响应的稳定性;云端 TX81 芯片在进行二次复核时,并行算力可快速处理关键帧数据,缩短复核耗时,且能根据不同场景的风险等级,动态调整算力分配,适配复核阈值的变化。 

图像更清晰,暗处更明亮
方案中,端侧初筛对算力精度要求相对灵活,清微智能边缘端芯片支持 int4、int8、int16 等量化精度,可根据轻量模型需求灵活选择,在保证检测灵敏度的同时降低功耗;云端复核需更高精度算力以提升判断准确性,清微智能研发中的芯片支持 FP16 精度,TX8云端芯片系列原生支持MXFP8格式与 MXFP4,FP8 精度误差近乎无损,端到端性能对标国际一流厂商旗舰产品,能完美适配 VL 大模型的高精度计算需求。 
可重构算力提升效率
清微智能核心的可重构计算技术(CGRA),通过将神经网络计算图拆解出的不同类型算子映射到计算阵列,构建灵活的硬件互联结构,形成可按需调配的算力资源。在端云协同方案中,这种重构能力可实现矩阵计算与向量计算模块的并行运作,同时支持计算与数据传输并行。例如,端侧芯片在处理初筛时,可通过可重构架构同步完成图像特征提取(向量计算)与目标初步识别(矩阵计算),大幅提升 响应的稳定性;云端 TX81 芯片在进行二次复核时,并行算力可快速处理关键帧数据,缩短复核耗时,且能根据不同场景的风险等级,动态调整算力分配,适配复核阈值的变化。