libtorch-yolov5推理运行

  • 一、模型文件导出
  • 二、项目创建
  • 2.1、测试代码下载
  • 2.2、文件拷贝
  • 2.3、代码优化修改
  • 2.4、其它准备工作
  • 三、代码运行
  • 3.1、参数修改
  • 3.2、修改完毕点击运行
  • 四、GPU版本推理
  • 4.1、GPU模型导出
  • 4.2、GPU模型推理


前期环境配置(vs+libtorch+opencv)可以参考博主另一篇博文vs配置opencv和libtorch(2.2.2)(cuda12.0),这里主要基于环境配置好之后如何运行yolov5的推理程序,并生成对应的.exe文件。

博主环境软件版本:

  • win10
  • pytorch 2.2.2
  • libtorch 2.2.2
  • opencv4.8.0
  • -cuda12.0

libtroch版本尽量和pytorch的版本一致,各版本libtorch下载地址。1.10.1版本该连接的博文中没有给出,可以直接修改后面的版本号,例如CPU-Release版本的地址为:

https://download.pytorch.org/libtorch/cpu/libtorch-win-shared-with-deps-1.10.1%2Bcpu.zip

博主查阅了很多博文,有的博文是通过cmake编译运行,博主vs新手,因为VS配置的libtorch和opencv是跟着项目的(在vs界面),博主暂时还没能把终端cmake编译和vs联系起来(配置好的环境容易崩掉),后边有时间再出一版结合cmake编译运行的方案。
所以这篇文章主要就是在vs端直接编译运行libtorch-yolov5程序,并生成对应的.exe文件。

一、模型文件导出

如果已经导出了GPU模型的朋友可以跳过这一步。
这一步是准备后续工作推理需要的模型文件,训练得到的.pt文件不能直接使用,需要转换为torchscript, onnx, coreml, saved_model, pb, tflite, tfjs等格式,博主以torchscript为例。

打开export.py,修改参数【‘–data’】数据集的.yaml文件为自己对应的.yaml文件地址,博主是CCPD.yamll;修改参数【‘–weights’】为自己训练好的权重文件地址,博主是runs/train/exp5/weights/best.pt(最后导出的模型文件也在此目录下);参数【‘–include’】,default参数修改为torchscript
除了直接修改参数,也可以在终端运行命令行:

python export.py --data data/CCPDMASK.yaml --weights runs/train/exp5/weights/best --include torchscript
.pt

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率

如下图所示,成功导出。

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_02


可以在相应的目录下看到该文件:

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_03

注意这里的导出参数【‘–imgsz’】和训练时的【‘–imgsz’】需保持一致,同理后续推理时的【‘–imgsz’】也保持一致。

export.py更多参数含义有兴趣的可以单独搜索下,这里不做赘述。

二、项目创建

接博文vs配置opencv和libtorch(2.2.2)(cuda12.0),环境已配置完毕,接下来就是项目创建。

2.1、测试代码下载

下载地址:libtorch-yolov5官方源码下载
这个项目是将yolov5训练好的模型用于推理,并生成.exe文件以及lib文件,用以后续部署的。

  • PyInstaller通过spec也可以打包模型恩建,方便不会使用Python脚本的研究人员使用,但不适用于工作中实际任务的深度学习模型部署(速度较低且占用空间)。

下载解压后如图所示:

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_04

2.2、文件拷贝

接博文vs配置opencv和libtorch(2.2.2)(cuda12.0)创建的项目Project3,分别在头文件和源文件里边创建【2.1】下载的libtorch-yolov5源码里的各个文件。
这给出两种方法:

  • 方法1:将源码中【src】和【include】目录里边的文件拷贝到D:\VCworkspace\Project3\Project3目录下,这个目录即为博主最开始创建的twst.cpp所在的文件目录;在右键【源文件】→【添加】→【现有项】,选择上一步拷贝的.cpp进行添加;头文件同理;添加完成后就可以在VS项目下看到对应的文件啦。(如果只是复制,VS好像并不能直接同步过来)
  • 方法2:分别点击头文件源文件并新建同名头文件,源文件后,将相应的代码拷贝过来。(如果要修改名字,注意引用时也应该修改,新手的话建议暂时不改)

创建完成后如图所示:

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_05

2.3、代码优化修改

这一步如果是运行训练时imgsz为640`且不会更改的模型文件,那可以跳过这不。但后续若更改训练尺寸大小的话,可以优化下源码。

在源码Run()函数中增加一个函数输入,目的是调整推理时,输入网络的图片尺寸大小;在main()函数中增加两个输入,“label”“imgsz”,别是标签文件所在的路径和输入网络的尺寸大小。

对应修改如下:

【detector.h】

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_06


【detector.cpp】

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_07


【main.cpp】

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_08


yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_09


yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_10

demo()函数中可增加一句代码,保存推理后的图片,地址给测试图片的路径地址。

2.4、其它准备工作

为了测试方便,博主新建一个文件用于存放测试相关的文件yolov5
将【一】中导出的模型文件拷贝到该目录下;测试图片bus.jpg也放置在此目录下;新建一个.names文件。
.names文件创建方法:
1) 文件夹里右键新建一个文本文件ccpdmask,打开后编辑训练的数据集的类别;

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_11

这里的类别名字同训练时的.yaml文件:

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_12

2)点击【查看】,勾选【文件扩展名】,将文本文件的后缀名.txt改为.names。如下图所示:

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_13

三、代码运行

3.1、参数修改

将箭头所示参数分别修改为【2.4】中对应文件的地址:

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_14


这里给生成推理结果图片的地址

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_10

3.2、修改完毕点击运行

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_16

成功运行。

在【3.1】给出的路径下也有推理结果的图片生成。

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_17

以上均是CPU版本模型的推理。

这里再更一个GPU版本的推理

四、GPU版本推理

4.1、GPU模型导出

与【一】中步骤类似,只需要修改一个参数‘'--device', default='0'’,这里是cpu,所以【一】中导出的推理模型即是cpu版本的。

libtorch_yolov5源码中介绍导出GPU版本还需要修改源码,如图:

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_18


即下图中所示:

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_19


博主两种都试了,暂时没有区别,欢迎懂哥评论区纠正。

这里再附一个网上博主写的模型导出的代码,GPU版本,需要的修改入参就可以啦:

"""Exports a YOLOv5 *.pt model to ONNX and TorchScript formats

Usage:
    $ export PYTHONPATH="$PWD" && python models/export.py --weights ./weights/yolov5s.pt --img 640 --batch 1
"""

import argparse
import sys
import time

sys.path.append('./')  # to run '$ python *.py' files in subdirectories

import torch
import torch.nn as nn

import models
from models.experimental import attempt_load
from utils.activations import Hardswish, SiLU
from utils.general import set_logging, check_img_size

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default='D:\\PythonWokspace\\JINX\\yolov5_master\\runs\\train\\exp5\\weights\\best.pt', help='weights path')  # from yolov5/models/
    parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='image size')  # height, width
    parser.add_argument('--batch-size', type=int, default=1, help='batch size')
    opt = parser.parse_args()
    opt.img_size *= 2 if len(opt.img_size) == 1 else 1  # expand
    print(opt)
    set_logging()
    t = time.time()

    # Load PyTorch model
    model = attempt_load(opt.weights, map_location=torch.device('cuda'))  # load FP32 model
    labels = model.names

    # Checks
    gs = int(max(model.stride))  # grid size (max stride)
    opt.img_size = [check_img_size(x, gs) for x in opt.img_size]  # verify img_size are gs-multiples

    # Input
    img = torch.zeros(opt.batch_size, 3, *opt.img_size).to(device='cuda')
    # image size(1,3,320,192) iDetection

    # Update model
    for k, m in model.named_modules():
        m._non_persistent_buffers_set = set()  # pytorch 1.6.0 compatibility
        if isinstance(m, models.common.Conv):  # assign export-friendly activations
            if isinstance(m.act, nn.Hardswish):
                m.act = Hardswish()
            elif isinstance(m.act, nn.SiLU):
                m.act = SiLU()
        # elif isinstance(m, models.yolo.Detect):
        #     m.forward = m.forward_export  # assign forward (optional)
    #model.model[-1].export = True  # set Detect() layer export=True
    model.model[-1].export = False
    y = model(img)  # dry run

    # TorchScript export
    try:
        print('\nStarting TorchScript export with torch %s...' % torch.__version__)
        f = opt.weights.replace('.pt', '.torchscript.pt')  # filename
        ts = torch.jit.trace(model, img)
        ts.save(f)
        print('TorchScript export success, saved as %s' % f)
    except Exception as e:
        print('TorchScript export failure: %s' % e)

    # ONNX export
    try:
        import onnx

        print('\nStarting ONNX export with onnx %s...' % onnx.__version__)
        f = opt.weights.replace('.pt', '.onnx')  # filename
        torch.onnx.export(model, img, f, verbose=False, opset_version=12, input_names=['images'],
                          output_names=['classes', 'boxes'] if y is None else ['output'])

        # Checks
        onnx_model = onnx.load(f)  # load onnx model
        onnx.checker.check_model(onnx_model)  # check onnx model
        # print(onnx.helper.printable_graph(onnx_model.graph))  # print a human readable model
        print('ONNX export success, saved as %s' % f)
    except Exception as e:
        print('ONNX export failure: %s' % e)

    # CoreML export
    try:
        import coremltools as ct

        print('\nStarting CoreML export with coremltools %s...' % ct.__version__)
        # convert model from torchscript and apply pixel scaling as per detect.py
        model = ct.convert(ts, inputs=[ct.ImageType(name='image', shape=img.shape, scale=1 / 255.0, bias=[0, 0, 0])])
        f = opt.weights.replace('.pt', '.mlmodel')  # filename
        model.save(f)
        print('CoreML export success, saved as %s' % f)
    except Exception as e:
        print('CoreML export failure: %s' % e)

    # Finish
    print('\nExport complete (%.2fs). Visualize with https://github.com/lutzroeder/netron.' % (time.time() - t))

4.2、GPU模型推理

如下图所示修改两个参数,‘weights’修改为【4.1】中导出的GPU模型路径;‘gpu’改为‘true’

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_20


成功运行:

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_21

终于拿下啦。