100ASK-V853-PRO开发板支持yolov5模型部署
-
100ASK_V853-PRO开发板支持yolov5模型部署
0.前言
本章节主要讲述如何获取yolov5单阶段目标检测算法,并将yolov5原始模型转换为ONNX格式。使用模型转换工具进行模型的转换,并将转换后的模型部署到开发板上。
本章使用的软件列表:
- anaconda(Windows)
- Git(Windows)
- Tina SDK(Linux)
- 全志NPU扩展包(Linux)
- OpenCV库(Linux)
硬件列表:
百问网100ASK_V853-PRO开发板:https://www.aw-ol.com/boards/16这里提供Source资源包:source (包含conda配置yolov5环境依赖包文件,端侧部署代码)
yolov5体验镜像:v853_linux_100ask_uart0.img (测试方法:yolov5 /etc/models/yolov5_model.nb <测试图像>)
YOLOV5官方提供的V6.0版本的资源:
yolov5s ONNX模型文件:https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.onnx
yolov5s PT模型文件:https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt
yolov5-v6.0代码:https://github.com/ultralytics/yolov5/archive/refs/tags/v6.0.zip
1.配置yolov5环境
yolov5官方网址为:https://github.com/ultralytics/yolov5
使用Git工具在任意目录下获取源码V6.0版本,输入
git clone -b v6.0 https://github.com/ultralytics/yolov5
如果您使用Git下载出现问题,也可以直接点击下面网址直接下载源码压缩包,下载完成解压即可正常使用。
https://github.com/ultralytics/yolov5/archive/refs/tags/v6.0.zip
等待下载完成,下载完成后会在当前目录下,查看到yolov5项目文件夹
100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5 $ ls yolov5/ 100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5 $ cd yolov5/ 100askTeam@DESKTOP-F46NFJT MINGW64 /d/Programmers/ModelDeployment/2.yolov5/yolov5 (master) $ ls CITATION.cff README.zh-CN.md detect.py requirements.txt tutorial.ipynb CONTRIBUTING.md benchmarks.py export.py segment/ utils/ LICENSE classify/ hubconf.py setup.cfg val.py README.md data/ models/ train.py
打开Anaconda Prompt (Anaconda3)软件,进入yolov5项目目录中,输入以下命令
(base) C:\Users\100askTeam>D: (base) D:\>cd D:\Programmers\ModelDeployment\2.yolov5\yolov5 (base) D:\Programmers\ModelDeployment\2.yolov5\yolov5>
使用conda创建yolov项目环境,输入
conda create -n my-yolov5-env python=3.7
激活yolov5环境
conda activate my-yolov5-env
安装依赖
pip install -U -r requirements.txt -i https://pypi.doubanio.com/simple/
FAQ:
搭建环境时由于版本的不同会遇各种问题,下面我会提供我配置好的环境所需的包文件版本,文件位于压缩包的requirements文件夹中的conda-yolov5_6-env.yaml。在Conda终端中创建新环境,执行
conda env create -f conda-yolov5_6-env.yaml
执行
python detect.py
,测试环境是否搭建成功,执行后会自动下载模型权重文件这里下载速度可能会很慢,建议直接访问官网下载https://github.com/ultralytics/yolov5/tree/v6.0,点击下图红框处的YOLOV5s。这里我下载 v6.0 版本的 yolov5s.onnx 模型作为示例。
下载地址:https://github.com/ultralytics/yolov5/releases/download/v6.0/yolov5s.pt
点进入后会进去yolov5资源中心,往下找到V6.0版本的资源下载界面,找到您所需的资源即可。
将该模型文件放在yolov5项目文件夹下,如下图所示:
在conda终端中输入
python detect.py
,可得到如下执行结果(my-yolov5-env) D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0>python detect.py detect: weights=yolov5s.pt, source=data\images, imgsz=[640, 640], conf_thres=0.25, iou_thres=0.45, max_det=1000, device=, view_img=False, save_txt=False, save_conf=False, save_crop=False, nosave=False, classes=None, agnostic_nms=False, augment=False, visualize=False, update=False, project=runs\detect, name=exp, exist_ok=False, line_thickness=3, hide_labels=False, hide_conf=False, half=False, dnn=False YOLOv5 2021-10-12 torch 2.0.1+cpu CPU Fusing layers... D:\Anaconda3\envs\my-yolov5-env\lib\site-packages\torch\functional.py:504: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\aten\src\ATen\native\TensorShape.cpp:3484.) return _VF.meshgrid(tensors, **kwargs) # type: ignore[attr-defined] Model Summary: 213 layers, 7225885 parameters, 0 gradients image 1/2 D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0\data\images\bus.jpg: 640x480 4 persons, 1 bus, Done. (0.274s) image 2/2 D:\Programmers\ModelDeployment\2.yolov5\yolov5-6.0\data\images\zidane.jpg: 384x640 2 persons, 1 tie, Done. (0.189s) Speed: 4.5ms pre-process, 231.3ms inference, 2.8ms NMS per image at shape (1, 3, 640, 640) Results saved to runs\detect\exp1
FAQ:
如果您执行此命令时,遇到如下报错:
原因:torch版本过高,可以通过修改代码或者降低版本。
下面我使用修改代码的方式解决:
修改
D:\Anaconda3\envs\my-yolov5-env\lib\site-packages\torch\nn\modules\upsampling.py
文件中的Upsample类中forward函数的返回值。原本:
def forward(self, input: Tensor) -> Tensor: return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners, recompute_scale_factor=self.recompute_scale_factor)
修改后:
def forward(self, input: Tensor) -> Tensor: return F.interpolate(input, self.size, self.scale_factor, self.mode, self.align_corners)
修改结果如下图所示:
执行
python detect.py
完成后,可以在yolov5项目文件夹下的runs\detect\exp1目录下找到执行后的输出结果,如下所示。2.导出yolov5 ONNX模型
2.1 export程序导出模型
在export.py程序找到parse_opt函数,查看默认输出的模型格式。如果默认支持有onnx格式,就无需修改,如果默认没有填写onnx,修改默认格式为onnx格式。
执行export.py函数前需要需要确保已经安装了onnx包,可手动安装,如下所示
pip install onnx==1.13.0 -i https://pypi.doubanio.com/simple/
执行export.py函数导出yolov5的onnx格式动态模型,在conda终端输入
python export.py --weights yolov5s.pt --include onnx --dynamic
执行完成后会在yolov5项目目录中生成一个名称为
yolov5s.onnx
的文件,如下图所示:2.2 简化模型
由于转换的模型是动态 Shape 的,不限制输入图片的大小,对于 NPU 来说会增加处理工序,所以这里我们需要转换为静态 Shape 的模型。
需要安装
onnxsim
工具,在conda终端输入pip install onnxsim -i https://pypi.doubanio.com/simple/
然后使用这条命令转换:
python -m onnxsim yolov5s.onnx yolov5s-sim.onnx --input-shape 1,3,640,640
执行完成后会导出名为
yolov5s-sim.onnx
文件,文件位于yolov5项目文件夹下,如下图所示:2.3 查看模型
使用开源网站Netron网站
访问上面网址查看模型结构。
选择
yolov5s-sim.onnx
文件,点击打开。查看如下图所示输出节点
可看到模型有 4 个输出节点,其中 ouput 节点为后处理解析后的节点;在实际测试的过程中,发现 NPU 量化操作后对后处理的运算非常不友好,输出数据偏差较大,所以我们可以将后处理部分放在 CPU 运行;因此保留
350
,498
,646
三个后处理解析前的输出节点即可,后文在导入模型时修改输出节点。3.转换NPU模型
3.1 创建转换目录
打开NPU工具包的虚拟机Ubuntu20.04,创建yolov5-6.0文件夹,存放模型和量化图像等。
ubuntu@ubuntu2004:~$ mkdir yolov5-6.0
进入yolov5模型转换目录。
ubuntu@ubuntu2004:~$ cd yolov5-6.0/
创建data目录存放量化图像
mkdir data
将量化图像传入data文件夹下,例如,传入
test01.jpg
图像到data
ubuntu@ubuntu2004:~/yolov5-test$ ls data test01.jpg
在yolov5模型转换目录中创建
dataset.txt
ubuntu@ubuntu2004:~/yolov5-6.0$ touch dataset.txt
修改
dataset.txt
文件ubuntu@ubuntu2004:~/yolov5-6.0$ vi dataset.txt
在
dataset.txt
文件中增加量化图片的路径../data/test01.jpg
将
yolov5s-sim.onnx
模型传入yolov5模型转换文件夹下。例如:ubuntu@ubuntu2004:~/yolov5-6.0$ ls data dataset.txt yolov5s-sim.onnx
工作目录的文件如下所示:
ubuntu@ubuntu2004:~/yolov5-6.0$ tree . ├── data │ └── test01.jpg ├── dataset.txt └── yolov5s-sim.onnx 1 directory, 3 files
3.2 导入模型
导入模型前需要知道我们要保留的输出节点,由之前查看到我们输出的三个后处理节点为:
350
,498
,646
。pegasus import onnx --model yolov5s-sim.onnx --output-data yolov5s-sim.data --output-model yolov5s-sim.json --outputs 350 498 646
导入生成两个文件,分别是是
yolov5s-sim.data
和yolov5s-sim.json
文件,两个文件是 YOLO V5 网络对应的芯原内部格式表示文件,data
文件储存权重,cfg
文件储存模型。3.3生成 YML 文件
YML 文件对网络的输入和输出的超参数进行描述以及配置,这些参数包括,输入输出 tensor 的形状,归一化系数 (均值,零点),图像格式,tensor 的输出格式,后处理方式等等
pegasus generate inputmeta --model yolov5s-sim.json --input-meta-output yolov5s-sim_inputmeta.yml
pegasus generate postprocess-file --model yolov5s-sim.json --postprocess-file-output yolov5s-sim_postprocess_file.yml
修改
yolov5s-sim_inputmeta.yml
文件中的的scale
参数为0.0039216(1/255)
,目的是对输入tensor
进行归一化,和网络进行训练的时候是对应的。vi yolov5s-sim_inputmeta.yml
3.4 量化
生成量化表文件,使用非对称量化,uint8,修改
--batch-size
参数为你的dataset.txt
里提供的图片数量。pegasus quantize --model yolov5s-sim.json --model-data yolov5s-sim.data --batch-size 1 --device CPU --with-input-meta yolov5s-sim_inputmeta.yml --rebuild --model-quantize yolov5s-sim.quantize --quantizer asymmetric_affine --qtype uint8
3.5 预推理
利用前文的量化表执行预推理,得到推理
tensor
pegasus inference --model yolov5s-sim.json --model-data yolov5s-sim.data --batch-size 1 --dtype quantized --model-quantize yolov5s-sim.quantize --device CPU --with-input-meta yolov5s-sim_inputmeta.yml --postprocess-file yolov5s-sim_postprocess_file.yml
3.6 导出模板代码与模型
输出的模型可以在
ovxilb/yolov5s-sim_nbg_unify
文件夹中找到network_binary.nb
文件。pegasus export ovxlib --model yolov5s-sim.json --model-data yolov5s-sim.data --dtype quantized --model-quantize yolov5s-sim.quantize --batch-size 1 --save-fused-graph --target-ide-project 'linux64' --with-input-meta yolov5s-sim_inputmeta.yml --output-path ovxilb/yolov5s-sim/yolov5s-simprj --pack-nbg-unify --postprocess-file yolov5s-sim_postprocessmeta.yml --optimize "VIP9000PICO_PID0XEE" --viv-sdk ${VIV_SDK}
将生成的
network_binary.nb
文件拷贝出来备用。4.YOLOV5端侧部署
4.1 配置yolov5端侧部署环境
在进行端侧部署前,由于后处理需要使用OpenCV库,所以请先按照如下步骤
-
配置OpenCV库:https://forums.100ask.net/t/topic/3349
配置完成后才能编译端侧部署程序。
下载
source
压缩包中的yolov5.tar.gz
,将该压缩包拷贝到虚拟机中,解压压缩包tar -xzvf yolov5.tar.gz
将解压出来的文件夹拷贝到
tina-v853-open/openwrt/package/npu/
目录下cp yolov5/ ~/workspaces/tina-v853-open/openwrt/package/npu/ -rf
注意:上面的
~/workspaces/tina-v853-open/openwrt/package/npu/
目录需要更换为您自己的SDK实际的目录。拷贝完成后,如下所示:
book@100ask:~/workspaces/tina-v853-open/openwrt/package/npu$ ls lenet viplite-driver vpm_run yolov3 yolov5
4.2 编译端侧部署代码
配置编译环境
book@100ask:~/workspaces/tina-v853-open$ source build/envsetup.sh ... book@100ask:~/workspaces/tina-v853-open$ lunch You're building on Linux Lunch menu... pick a combo: 1 v853-100ask-tina 2 v853-vision-tina Which would you like? [Default v853-100ask]: 1 ...
进入Tina配置界面
book@100ask:~/workspaces/tina-v853-open$ make menuconfig
进入如下目录,选中yolov5后即可编译端侧部署程序
> 100ask > NPU <*> yolov5....................................................... yolov5 demo <*> yolov5-model...................................... yolov5 test demo model
注意:yolov5-model该选择后会将yolov5_model.nb打包进镜像中,该模型文件会在/etc/models/目录下。
保存并退出Tina配置界面。
编译Tina SDK镜像,编译完成后打包生成镜像
book@100ask:~/workspaces/tina-v853-open$ make ... book@100ask:~/workspaces/tina-v853-open$ pack
注意:如果您将模型打包进镜像中,可能会出现文件系统大小设置值太小的问题们可以参考https://forums.100ask.net/t/topic/3158解决。
打包完成后,使用全志烧写工具进行烧写新镜像,如果您还不会烧写系统,请参考:https://forums.100ask.net/t/topic/3403
4.3 测试yolov5端侧部署
测试图像文件要求:
- 图片
- 尺寸:640*640
开发板端:
使用ADB将测试图片传输到开发板上,将USB0的模式切换到 Device 模式
cat /sys/devices/platform/soc/usbc0/usb_device
主机端:
将ADB设备连接上虚拟机,并将虚拟机中的测试图片传输到开发板中,查看ADB设备
book@100ask:~/workspaces/testImg$ adb devices List of devices attached 20080411 device
查看需要传输的文件
book@100ask:~/workspaces/testImg$ ls bus_640-640.jpg bus_640-640.jpg
传输文件到开发板中
book@100ask:~/workspaces/testImg$ adb push bus_640-640.jpg /mnt/UDISK bus_640-640.jpg: 1 file pushed. 0.7 MB/s (97293 bytes in 0.128s)
开发板端:
进入测试图像目录
root@TinaLinux:/# cd /mnt/UDISK/ root@TinaLinux:/mnt/UDISK# ls bus_640-640.jpg lost+found overlay
yolov5程序参数要求:yolov5 <模型文件路径> <测试图像路径>
如果您打包了默认的yolov5模型文件,可以输入
yolov5 /etc/models/yolov5_model.nb ./bus_640-640.jpg
如果您需要选择自己的模型文件进行测试,可以将上面的
/etc/models/yolov5_model.nb
更换为自己的模型路径,下面我以默认的模型文件进行测试。
查看输出图像文件
yolov5_out.jpg
root@TinaLinux:/mnt/UDISK# ls bus_640-640.jpg lost+found overlay yolov5_out.jpg
主机端:
拉取输出文件
yolov5_out.jpg
到当前文件夹下book@100ask:~/workspaces/testImg$ adb pull /mnt/UDISK/yolov5_out.jpg ./ /mnt/UDISK/yolov5_out.jpg: 1 file pulled. 0.9 MB/s (184894 bytes in 0.202s)
![image-20230625172512521](${media}/ image-20230625172512521.png)
4.4 测试其他图像
对于人形的识别,该模型还是比较准确的
对于交通道路这种复杂的情况,对于行人丢失些许目标,但对于车辆效果很好,丢失情况较少。
测试动物,对于动物的检测该模型是十分准确的,检测效果即预测精度都较高。
Copyright © 2024 深圳全志在线有限公司 粤ICP备2021084185号 粤公网安备44030502007680号