100ASK-V853-PRO开发板支持yolov5模型部署

100ask LV 6

100ASK_V853-PRO开发板支持yolov5模型部署

0.前言

本章节主要讲述如何获取yolov5单阶段目标检测算法，并将yolov5原始模型转换为ONNX格式。使用模型转换工具进行模型的转换，并将转换后的模型部署到开发板上。

本章使用的软件列表：

anaconda（Windows）
Git（Windows)
Tina SDK（Linux）
全志NPU扩展包（Linux）
OpenCV库（Linux）

硬件列表：
百问网100ASK_V853-PRO开发板：https://www.aw-ol.com/boards/16

这里提供Source资源包：source （包含conda配置yolov5环境依赖包文件，端侧部署代码）

yolov5体验镜像：v853_linux_100ask_uart0.img （测试方法：yolov5 /etc/models/yolov5_model.nb <测试图像>）

YOLOV5官方提供的V6.0版本的资源：

yolov5s ONNX模型文件:https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.onnx

yolov5s PT模型文件：https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt

yolov5-v6.0代码：https://github.com/ultralytics/yolov5/archive/refs/tags/v6.0.zip

1.配置yolov5环境

yolov5官方网址为：https://github.com/ultralytics/yolov5

使用Git工具在任意目录下获取源码V6.0版本，输入

git clone -b v6.0 https://github.com/ultralytics/yolov5

如果您使用Git下载出现问题，也可以直接点击下面网址直接下载源码压缩包，下载完成解压即可正常使用。

https://github.com/ultralytics/yolov5/archive/refs/tags/v6.0.zip

等待下载完成，下载完成后会在当前目录下，查看到yolov5项目文件夹

100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5
$ ls
yolov5/

100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5
$ cd yolov5/

100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5/yolov5 (master)
$ ls
CITATION.cff     README.zh-CN.md  detect.py   requirements.txt  tutorial.ipynb
CONTRIBUTING.md  benchmarks.py    export.py   segment/          utils/
LICENSE          classify/        hubconf.py  setup.cfg         val.py
README.md        data/            models/     train.py

打开Anaconda Prompt (Anaconda3)软件，进入yolov5项目目录中，输入以下命令

(base) C:\Users\100askTeam>D:

(base) D:\>cd D:\Programmers\ModelDeployment\2.yolov5\yolov5

(base) D:\Programmers\ModelDeployment\2.yolov5\yolov5>

使用conda创建yolov项目环境，输入

conda create -n my-yolov5-env python=3.7

激活yolov5环境

conda activate my-yolov5-env

安装依赖

pip install -U -r requirements.txt -i https://pypi.doubanio.com/simple/

替代文字

FAQ：

搭建环境时由于版本的不同会遇各种问题，下面我会提供我配置好的环境所需的包文件版本，文件位于压缩包的requirements文件夹中的conda-yolov5_6-env.yaml。在Conda终端中创建新环境，执行

conda env create -f conda-yolov5_6-env.yaml

执行python detect.py，测试环境是否搭建成功，执行后会自动下载模型权重文件

这里下载速度可能会很慢，建议直接访问官网下载https://github.com/ultralytics/yolov5/tree/v6.0，点击下图红框处的YOLOV5s。这里我下载 v6.0 版本的 yolov5s.onnx 模型作为示例。

下载地址：https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt

替代文字

点进入后会进去yolov5资源中心，往下找到V6.0版本的资源下载界面，找到您所需的资源即可。

替代文字

将该模型文件放在yolov5项目文件夹下，如下图所示：

替代文字

在conda终端中输入python detect.py，可得到如下执行结果

(my-yolov5-env) D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0>python detect.py
detect: weights=yolov5s.pt, source=data\images, imgsz=[640, 640], conf_thres=0.25, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False
YOLOv5  2021-10-12 torch 2.0.1+cpu CPU

Fusing layers...
D:\Anaconda3\envs\my-yolov5-env\lib\site-packages\torch\functional.py:504: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\aten\src\ATen\native\TensorShape.cpp:3484.)
  return _VF.meshgrid(tensors, **kwargs)  # type: ignore[attr-defined]
Model Summary: 213 layers, 7225885 parameters, 0 gradients
image 1/2 D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0\data\images\bus.jpg: 640x480 4 persons, 1 bus, Done. (0.274s)
image 2/2 D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0\data\images\zidane.jpg: 384x640 2 persons, 1 tie, Done. (0.189s)
Speed: 4.5ms pre-process, 231.3ms inference, 2.8ms NMS per image at shape (1, 3, 640, 640)
Results saved to runs\detect\exp1

FAQ:

如果您执行此命令时，遇到如下报错：
替代文字

原因：torch版本过高，可以通过修改代码或者降低版本。

下面我使用修改代码的方式解决：

修改D:\Anaconda3\envs\my-yolov5-env\lib\site-packages\torch\nn\modules\upsampling.py文件中的Upsample类中forward函数的返回值。

原本：

    def forward(self, input: Tensor) -> Tensor:
        return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners,
                             recompute_scale_factor=self.recompute_scale_factor)

修改后：

    def forward(self, input: Tensor) -> Tensor:
        return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners)

修改结果如下图所示：

替代文字

执行python detect.py完成后，可以在yolov5项目文件夹下的runs\detect\exp1目录下找到执行后的输出结果，如下所示。

替代文字

2.导出yolov5 ONNX模型

2.1 export程序导出模型

在export.py程序找到parse_opt函数，查看默认输出的模型格式。如果默认支持有onnx格式，就无需修改，如果默认没有填写onnx，修改默认格式为onnx格式。

执行export.py函数前需要需要确保已经安装了onnx包，可手动安装，如下所示

pip install onnx==1.13.0 -i https://pypi.doubanio.com/simple/

执行export.py函数导出yolov5的onnx格式动态模型，在conda终端输入

python export.py --weights yolov5s.pt --include onnx --dynamic

执行完成后会在yolov5项目目录中生成一个名称为yolov5s.onnx的文件，如下图所示：

2.2 简化模型

由于转换的模型是动态 Shape 的，不限制输入图片的大小，对于 NPU 来说会增加处理工序，所以这里我们需要转换为静态 Shape 的模型。

需要安装 onnxsim 工具，在conda终端输入

pip install onnxsim -i https://pypi.doubanio.com/simple/

然后使用这条命令转换：

python -m onnxsim yolov5s.onnx yolov5s-sim.onnx --input-shape 1,3,640,640

执行完成后会导出名为yolov5s-sim.onnx文件，文件位于yolov5项目文件夹下，如下图所示：

2.3 查看模型

使用开源网站Netron网站

https://netron.app/

访问上面网址查看模型结构。

选择yolov5s-sim.onnx文件，点击打开。

查看如下图所示输出节点

可看到模型有 4 个输出节点，其中 ouput 节点为后处理解析后的节点；在实际测试的过程中，发现 NPU 量化操作后对后处理的运算非常不友好，输出数据偏差较大，所以我们可以将后处理部分放在 CPU 运行；因此保留 350，498，646 三个后处理解析前的输出节点即可，后文在导入模型时修改输出节点。

3.转换NPU模型

3.1 创建转换目录

打开NPU工具包的虚拟机Ubuntu20.04，创建yolov5-6.0文件夹，存放模型和量化图像等。

ubuntu@ubuntu2004:~$ mkdir yolov5-6.0

进入yolov5模型转换目录。

ubuntu@ubuntu2004:~$ cd yolov5-6.0/

创建data目录存放量化图像

mkdir data

将量化图像传入data文件夹下，例如，传入test01.jpg图像到data

ubuntu@ubuntu2004:~/yolov5-test$ ls data
test01.jpg

在yolov5模型转换目录中创建dataset.txt

ubuntu@ubuntu2004:~/yolov5-6.0$ touch dataset.txt

修改dataset.txt文件

ubuntu@ubuntu2004:~/yolov5-6.0$ vi dataset.txt

在dataset.txt文件中增加量化图片的路径.

./data/test01.jpg

将yolov5s-sim.onnx模型传入yolov5模型转换文件夹下。例如：

ubuntu@ubuntu2004:~/yolov5-6.0$ ls
data  dataset.txt  yolov5s-sim.onnx

工作目录的文件如下所示：

ubuntu@ubuntu2004:~/yolov5-6.0$ tree
.
├── data
│   └── test01.jpg
├── dataset.txt
└── yolov5s-sim.onnx

1 directory, 3 files

3.2 导入模型

导入模型前需要知道我们要保留的输出节点，由之前查看到我们输出的三个后处理节点为：350，498，646 。

pegasus import onnx --model yolov5s-sim.onnx --output-data yolov5s-sim.data --output-model yolov5s-sim.json --outputs 350 498 646

导入生成两个文件，分别是是 yolov5s-sim.data 和 yolov5s-sim.json 文件，两个文件是 YOLO V5 网络对应的芯原内部格式表示文件，data 文件储存权重，cfg 文件储存模型。

3.3生成 YML 文件

YML 文件对网络的输入和输出的超参数进行描述以及配置，这些参数包括，输入输出 tensor 的形状，归一化系数 (均值，零点)，图像格式，tensor 的输出格式，后处理方式等等

pegasus generate inputmeta --model yolov5s-sim.json --input-meta-output yolov5s-sim_inputmeta.yml

pegasus generate postprocess-file --model yolov5s-sim.json --postprocess-file-output yolov5s-sim_postprocess_file.yml

修改 yolov5s-sim_inputmeta.yml 文件中的的 scale 参数为 0.0039216(1/255)，目的是对输入 tensor 进行归一化，和网络进行训练的时候是对应的。

vi yolov5s-sim_inputmeta.yml

3.4 量化

生成量化表文件，使用非对称量化，uint8，修改 --batch-size 参数为你的 dataset.txt 里提供的图片数量。

pegasus quantize --model yolov5s-sim.json --model-data yolov5s-sim.data --batch-size 1 --device CPU --with-input-meta yolov5s-sim_inputmeta.yml --rebuild --model-quantize yolov5s-sim.quantize --quantizer asymmetric_affine --qtype uint8

3.5 预推理

利用前文的量化表执行预推理，得到推理 tensor

pegasus inference --model yolov5s-sim.json --model-data yolov5s-sim.data --batch-size 1 --dtype quantized --model-quantize yolov5s-sim.quantize --device CPU --with-input-meta yolov5s-sim_inputmeta.yml --postprocess-file yolov5s-sim_postprocess_file.yml

3.6 导出模板代码与模型

输出的模型可以在 ovxilb/yolov5s-sim_nbg_unify 文件夹中找到network_binary.nb文件。

pegasus export ovxlib --model yolov5s-sim.json --model-data yolov5s-sim.data --dtype quantized --model-quantize yolov5s-sim.quantize --batch-size 1 --save-fused-graph --target-ide-project 'linux64' --with-input-meta yolov5s-sim_inputmeta.yml --output-path ovxilb/yolov5s-sim/yolov5s-simprj --pack-nbg-unify --postprocess-file yolov5s-sim_postprocessmeta.yml --optimize "VIP9000PICO_PID0XEE" --viv-sdk ${VIV_SDK}

将生成的network_binary.nb文件拷贝出来备用。

4.YOLOV5端侧部署

4.1 配置yolov5端侧部署环境

在进行端侧部署前，由于后处理需要使用OpenCV库，所以请先按照如下步骤

配置NPU拓展包：https://forums.100ask.net/t/topic/3224
配置OpenCV库：https://forums.100ask.net/t/topic/3349

配置完成后才能编译端侧部署程序。

下载source压缩包中的yolov5.tar.gz，将该压缩包拷贝到虚拟机中，解压压缩包

tar -xzvf yolov5.tar.gz

将解压出来的文件夹拷贝到tina-v853-open/openwrt/package/npu/目录下

cp yolov5/ ~/workspaces/tina-v853-open/openwrt/package/npu/ -rf

注意：上面的~/workspaces/tina-v853-open/openwrt/package/npu/目录需要更换为您自己的SDK实际的目录。

拷贝完成后，如下所示：

book@100ask:~/workspaces/tina-v853-open/openwrt/package/npu$ ls
lenet  viplite-driver  vpm_run  yolov3  yolov5

4.2 编译端侧部署代码

配置编译环境

book@100ask:~/workspaces/tina-v853-open$ source build/envsetup.sh 
...
book@100ask:~/workspaces/tina-v853-open$ lunch

You're building on Linux

Lunch menu... pick a combo:
     1  v853-100ask-tina
     2  v853-vision-tina
Which would you like? [Default v853-100ask]: 1
...

进入Tina配置界面

book@100ask:~/workspaces/tina-v853-open$ make menuconfig

进入如下目录，选中yolov5后即可编译端侧部署程序

> 100ask 
	> NPU 
		<*> yolov5....................................................... yolov5 demo             
		<*>   yolov5-model...................................... yolov5 test demo model

注意：yolov5-model该选择后会将yolov5_model.nb打包进镜像中，该模型文件会在/etc/models/目录下。

保存并退出Tina配置界面。

编译Tina SDK镜像，编译完成后打包生成镜像

book@100ask:~/workspaces/tina-v853-open$ make
...
book@100ask:~/workspaces/tina-v853-open$ pack

注意：如果您将模型打包进镜像中，可能会出现文件系统大小设置值太小的问题们可以参考https://forums.100ask.net/t/topic/3158解决。

打包完成后，使用全志烧写工具进行烧写新镜像，如果您还不会烧写系统，请参考：https://forums.100ask.net/t/topic/3403

4.3 测试yolov5端侧部署

测试图像文件要求：

图片
尺寸：640*640

开发板端：

使用ADB将测试图片传输到开发板上，将USB0的模式切换到 Device 模式

cat /sys/devices/platform/soc/usbc0/usb_device

主机端：

将ADB设备连接上虚拟机，并将虚拟机中的测试图片传输到开发板中，查看ADB设备

book@100ask:~/workspaces/testImg$ adb devices
List of devices attached
20080411	device

查看需要传输的文件

book@100ask:~/workspaces/testImg$ ls bus_640-640.jpg 
bus_640-640.jpg

传输文件到开发板中

book@100ask:~/workspaces/testImg$ adb push bus_640-640.jpg /mnt/UDISK
bus_640-640.jpg: 1 file pushed. 0.7 MB/s (97293 bytes in 0.128s)

开发板端：

进入测试图像目录

root@TinaLinux:/# cd /mnt/UDISK/
root@TinaLinux:/mnt/UDISK# ls
bus_640-640.jpg  lost+found       overlay

yolov5程序参数要求：yolov5 <模型文件路径> <测试图像路径>

如果您打包了默认的yolov5模型文件，可以输入

yolov5 /etc/models/yolov5_model.nb ./bus_640-640.jpg

如果您需要选择自己的模型文件进行测试，可以将上面的/etc/models/yolov5_model.nb更换为自己的模型路径，下面我以默认的模型文件进行测试。

查看输出图像文件yolov5_out.jpg

root@TinaLinux:/mnt/UDISK# ls 
bus_640-640.jpg  lost+found       overlay          yolov5_out.jpg

主机端：

拉取输出文件yolov5_out.jpg到当前文件夹下

book@100ask:~/workspaces/testImg$ adb pull /mnt/UDISK/yolov5_out.jpg ./
/mnt/UDISK/yolov5_out.jpg: 1 file pulled. 0.9 MB/s (184894 bytes in 0.202s)

![image-20230625172512521](${media}/ image-20230625172512521.png)

4.4 测试其他图像

对于人形的识别，该模型还是比较准确的

对于交通道路这种复杂的情况，对于行人丢失些许目标，但对于车辆效果很好，丢失情况较少。

测试动物，对于动物的检测该模型是十分准确的，检测效果即预测精度都较高。