首页> 新闻动态> 产品技术> 算能 (SOPHON) CV186AH 核心板开发工具链详解

算能 (SOPHON) CV186AH 核心板开发工具链详解

作者：万物纵横

发布时间：2025-11-25 09:49

阅读量：

CV186AH 核心板开发基于算能 (SOPHON) 官方提供的一站式 SDK，这套工具链完整覆盖从模型转换到应用部署的全流程开发需求，支持 C/C++ 和 Python 两种开发语言，兼容主流 AI 框架，专为 7.2 TOPS 的 TPU 算力优化。

算能 (SOPHON) CV186AH 核心板开发工具链详解(图1)

一、SOPHONSDK 整体架构

SOPHONSDK是 CV186AH 开发的核心，包含以下关键组件：

组件	功能描述
TPU-MLIR	模型编译器，将各类框架模型转为 BModel 格式
BModel	算能 TPU 专用模型格式，含权重和指令流
sophon-sail	C++/Python API 封装库，简化硬件交互
BMCV	硬件加速图像处理库
BMRuntime	模型运行时环境，负责模型加载与推理
sophon-media	多媒体处理库，支持视频编解码
isp-tools	ISP 参数调节工具，优化图像质量
交叉编译工具链	用于 x86 主机编译 ARM 平台代码

二、模型开发流程与工具

1. 模型转换流程

CV186AH 支持的模型转换路径：

主流框架(ONNX/Caffe/TensorFlow/PyTorch/Paddle) → TPU-MLIR → BModel → 部署

核心工具：TPU-MLIR

支持 FP32/INT8/INT4 量化，提升推理性能

自动优化算子，适配 CV186AH 的 TPU 架构

支持多核心并行计算 (最多 2 核)

转换步骤示例：

# 安装TPU-MLIR环境

pip install tpu_mlir[onnx,torch] # 安装ONNX和PyTorch支持

# FP32模型生成

model_deploy.py --model input.onnx --chip cv186ah --output output_fp32.bmodel

# INT8量化模型生成

model_deploy.py --model input.onnx --chip cv186ah --output output_int8.bmodel --quant

2. 模型性能与精度验证

tpu-perf：性能测试工具，测量推理速度、内存占用

精度对比工具：比较原始模型与量化后模型的精度差异

三、应用开发工具链

1. 交叉编译环境

CV186AH 采用 Aarch64 架构，需在 x86 主机上进行交叉编译：

工具链组成：

aarch64-linux-gnu-gcc/g++：编译器

binutils：链接器、汇编器等

glibc/musl：C 库

SDK 集成方式：

# CMake配置示例

set(CMAKE_SYSTEM_NAME Linux)

set(CMAKE_SYSTEM_PROCESSOR aarch64)

set(CMAKE_C_COMPILER aarch64-linux-gnu-gcc)

set(CMAKE_CXX_COMPILER aarch64-linux-gnu-g++)

set(CMAKE_FIND_ROOT_PATH /path/to/sophgo-sdk)

# 优先使用SDK中的库

set(CMAKE_FIND_ROOT_PATH_MODE_PROGRAM NEVER)

set(CMAKE_FIND_ROOT_PATH_MODE_LIBRARY ONLY)

set(CMAKE_FIND_ROOT_PATH_MODE_INCLUDE ONLY)

2. sophon-sail：统一 API 接口库

sophon-sail是开发 CV186AH 应用的主要接口，提供：

C++ 接口：高性能推理，适合资源密集型应用

Python 接口：快速原型开发，适合算法验证

基本使用流程：

# Python示例：加载模型并推理

import sophon.sail as sail

# 初始化引擎

engine = sail.Engine("model.bmodel", sail.IOMode.SYSO)

# 准备输入输出

input_tensor = engine.get_input(0)

output_tensor = engine.get_output(0)

# 执行推理

engine.forward(input_tensor, output_tensor)

3. 多媒体与 ISP 工具

sophon-media：视频编解码加速，支持 16 路 1080P@30fps

isp-tools：

调节 3A (AE/AWB/AF)、宽动态、3D 降噪等参数

支持配置文件导入导出：isp_tool read_config config.json

四、调试与性能优化工具

1. 调试工具链

GDB 远程调试：

目标板运行 gdbserver，主机通过 gdb 连接调试

支持断点、单步、变量查看等标准调试功能

内存调试：

Valgrind：检测内存泄漏、越界访问

系统工具：top、free、strace监控系统资源与调用

2. 性能优化利器

模型优化：

量化 (INT8/INT4)：提升 2-4 倍推理速度，降低内存占用

算子融合：减少 CPU 与 TPU 间数据传输

多核心并行：利用 CV186AH 双核心架构

内存管理优化：

合理分配 NPU 和 VPP 内存：./memory_edit.sh -c -npu 768 -vpp 1280

使用专用内存堆：NPU 用 heap0，图像处理用 heap1

五、开发环境搭建步骤

获取 SDK：

# 官网下载

wget https://developer.sophgo.com/site/index/material/89/all.html

# 源码获取

repo init -u https://github.com/sophgo/sophon-manifest -b release

repo sync

环境准备：

# 推荐使用Docker容器开发

docker pull sophgo/tpuc_dev:latest

docker run --privileged -v $PWD:/workspace -it sophgo/tpuc_dev:latest

交叉编译配置：

# 设置环境变量

export PATH=/path/to/sophgo-sdk/bin:$PATH

export LD_LIBRARY_PATH=/path/to/sophgo-sdk/lib/aarch64-linux-gnu:$LD_LIBRARY_PATH

六、应用开发示例

以YOLOv5 目标检测为例的开发流程：

模型准备：将 PyTorch 模型转为 ONNX 格式

模型转换：使用 TPU-MLIR 生成 INT8 量化 BModel

应用开发：

# 初始化sophon-sail引擎

engine = sail.Engine("yolov5s_int8.bmodel", sail.IOMode.SYSO)

# 图像预处理

img = cv2.imread("test.jpg")

img = cv2.resize(img, (640, 640))

# 推理

output = engine.forward(img)

# 结果后处理

boxes = postprocess(output)

draw_bboxes(img, boxes)

七、总结

CV186AH 的SOPHONSDK 开发工具链提供了完整的 AI 应用开发解决方案，从模型转换、应用开发到调试优化的全流程支持，大幅降低了边缘 AI 开发门槛。

核心优势：

一站式解决方案，无需整合多种工具

高性能推理：7.2 TOPS 算力，支持多路视频实时分析

灵活开发：C++/Python 双语言支持，适配主流 AI 框架

完善生态：文档、示例、社区全面支持

- END -

上一篇：如何使用CV186AH核心板开发工具链进行模型转换？返回列表下一篇：已经没有了

算能 (SOPHON) CV186AH 核心板开发工具链详解

需求留言: