2.1 移植开发综述

基于Sophon BM168X芯片进行产品开发会经历如下几个阶段：

评测选型：根据应用场景，确定使用的产品形态。
模型迁移：将原始深度学习框架下训练生成的模型转换为BM168x平台运行的FP32 BModel，必要时使用BMLang开发不支持的算子；使用量化集量化生成INT8 BModel，并测试调优确保INT8 BModel精度符合要求（推荐使用4N Batch BModel以获得最佳性能）。
算法移植：基于BM168X硬件加速接口，对模型的前后处理及推理现有算法进行移植。
程序移植：移植任务管理、资源调度等算法引擎代码及逻辑处理、结果展示、数据推送等业务代码。
测试调优：网络性能与精度测试、压力测试，基于网络编译、量化工具、多卡多芯、任务流水线等方面的深度优化。
部署联调：将算法服务打包(如Docker)部署到BM168X硬件产品上，并在实际场景中与业务平台或集成平台进行功能联调；必要时在生产环境中调整参数配置并收集数据进一步优化模型。

在移植工作开始前，请先确保已经按照第一节的内容下载并安装配置好所需环境：

一个典型的AI视频分析任务pipeline，通常包括：视频源 > 视频解码 > 预处理 > 推理 > 后处理 > 业务逻辑 > 视频/图片编码等环节。Sophon设备对各环节的硬件加速支持情况如下：

算法步骤

支持硬件加速

BM-OpenCV

BM-FFmpeg

Native接口

视频/图片编解码

支持

BMCV（图片）/SAIL

输入预处理

支持

BMCV/SAIL

模型推理

支持

BMRuntime/SAIL

输出后处理

部分支持

BMCV

最后更新于3年前