yolov5如何提高gpu利用率 yolov5使用gpu训练

转载

mob64ca1414c613 2024-08-20 08:18:40

文章标签 yolov5如何提高gpu利用率 YOLO c++ opencv 目标检测 文章分类 游戏开发

libtorch-yolov5推理运行

一、模型文件导出
二、项目创建

2.1、测试代码下载
2.2、文件拷贝
2.3、代码优化修改
2.4、其它准备工作

三、代码运行

3.1、参数修改
3.2、修改完毕点击运行

四、GPU版本推理

4.1、GPU模型导出
4.2、GPU模型推理

前期环境配置（vs+libtorch+opencv）可以参考博主另一篇博文vs配置opencv和libtorch（2.2.2）（cuda12.0），这里主要基于环境配置好之后如何运行yolov5的推理程序，并生成对应的.exe文件。

博主环境软件版本：

win10
pytorch 2.2.2
libtorch 2.2.2
opencv4.8.0
-cuda12.0

libtroch版本尽量和pytorch的版本一致，各版本libtorch下载地址。1.10.1版本该连接的博文中没有给出，可以直接修改后面的版本号，例如CPU-Release版本的地址为：

https://download.pytorch.org/libtorch/cpu/libtorch-win-shared-with-deps-1.10.1%2Bcpu.zip

博主查阅了很多博文，有的博文是通过cmake编译运行，博主vs新手，因为VS配置的libtorch和opencv是跟着项目的（在vs界面），博主暂时还没能把终端cmake编译和vs联系起来（配置好的环境容易崩掉），后边有时间再出一版结合cmake编译运行的方案。
所以这篇文章主要就是在vs端直接编译运行libtorch-yolov5程序，并生成对应的.exe文件。

一、模型文件导出

如果已经导出了GPU模型的朋友可以跳过这一步。
这一步是准备后续工作推理需要的模型文件，训练得到的.pt文件不能直接使用，需要转换为torchscript, onnx, coreml, saved_model, pb, tflite, tfjs等格式，博主以torchscript为例。

打开export.py，修改参数【‘–data’】数据集的.yaml文件为自己对应的.yaml文件地址，博主是CCPD.yamll；修改参数【‘–weights’】为自己训练好的权重文件地址，博主是runs/train/exp5/weights/best.pt（最后导出的模型文件也在此目录下）;参数【‘–include’】,default参数修改为torchscript。
除了直接修改参数，也可以在终端运行命令行：

python export.py --data data/CCPDMASK.yaml --weights runs/train/exp5/weights/best --include torchscript
.pt

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率

如下图所示，成功导出。

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_02

可以在相应的目录下看到该文件：

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_03

注意这里的导出参数【‘–imgsz’】和训练时的【‘–imgsz’】需保持一致，同理后续推理时的【‘–imgsz’】也保持一致。

export.py更多参数含义有兴趣的可以单独搜索下，这里不做赘述。

二、项目创建

接博文vs配置opencv和libtorch（2.2.2）（cuda12.0），环境已配置完毕，接下来就是项目创建。

2.1、测试代码下载

下载地址：libtorch-yolov5官方源码下载。
这个项目是将yolov5训练好的模型用于推理，并生成.exe文件以及lib文件，用以后续部署的。

PyInstaller通过spec也可以打包模型恩建，方便不会使用Python脚本的研究人员使用，但不适用于工作中实际任务的深度学习模型部署(速度较低且占用空间)。

下载解压后如图所示：

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_04

2.2、文件拷贝

接博文vs配置opencv和libtorch（2.2.2）（cuda12.0）创建的项目Project3，分别在头文件和源文件里边创建【2.1】下载的libtorch-yolov5源码里的各个文件。
这给出两种方法：

方法1：将源码中【src】和【include】目录里边的文件拷贝到D:\VCworkspace\Project3\Project3目录下，这个目录即为博主最开始创建的twst.cpp所在的文件目录；在右键【源文件】→【添加】→【现有项】，选择上一步拷贝的.cpp进行添加；头文件同理；添加完成后就可以在VS项目下看到对应的文件啦。（如果只是复制，VS好像并不能直接同步过来）
方法2：分别点击头文件源文件并新建同名头文件，源文件后，将相应的代码拷贝过来。（如果要修改名字，注意引用时也应该修改，新手的话建议暂时不改）

创建完成后如图所示：

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_05

2.3、代码优化修改

这一步如果是运行训练时imgsz为640`且不会更改的模型文件，那可以跳过这不。但后续若更改训练尺寸大小的话，可以优化下源码。

在源码Run()函数中增加一个函数输入，目的是调整推理时，输入网络的图片尺寸大小；在main()函数中增加两个输入，“label”和“imgsz”，别是标签文件所在的路径和输入网络的尺寸大小。

对应修改如下：

【detector.h】

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_06

【detector.cpp】

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_07

【main.cpp】

yolov5如何提高gpu利用率 yolov5使用gpu训练_opencv_08

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_09

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_10

demo()函数中可增加一句代码，保存推理后的图片，地址给测试图片的路径地址。

2.4、其它准备工作

为了测试方便，博主新建一个文件用于存放测试相关的文件yolov5。
将【一】中导出的模型文件拷贝到该目录下；测试图片bus.jpg也放置在此目录下；新建一个.names文件。
.names文件创建方法：
1）文件夹里右键新建一个文本文件ccpdmask，打开后编辑训练的数据集的类别；

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_11

这里的类别名字同训练时的.yaml文件：

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_12

2）点击【查看】，勾选【文件扩展名】，将文本文件的后缀名.txt改为.names。如下图所示：

yolov5如何提高gpu利用率 yolov5使用gpu训练_YOLO_13

三、代码运行

3.1、参数修改

将箭头所示参数分别修改为【2.4】中对应文件的地址：

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_14

这里给生成推理结果图片的地址

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_10

3.2、修改完毕点击运行

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_16

成功运行。

在【3.1】给出的路径下也有推理结果的图片生成。

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_17

以上均是CPU版本模型的推理。

这里再更一个GPU版本的推理

四、GPU版本推理

4.1、GPU模型导出

与【一】中步骤类似，只需要修改一个参数‘'--device', default='0'’，这里是cpu，所以【一】中导出的推理模型即是cpu版本的。

libtorch_yolov5源码中介绍导出GPU版本还需要修改源码，如图：

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_18

即下图中所示：

yolov5如何提高gpu利用率 yolov5使用gpu训练_c++_19

博主两种都试了，暂时没有区别，欢迎懂哥评论区纠正。

这里再附一个网上博主写的模型导出的代码，GPU版本，需要的修改入参就可以啦：

"""Exports a YOLOv5 *.pt model to ONNX and TorchScript formats

Usage:
    $ export PYTHONPATH="$PWD" && python models/export.py --weights ./weights/yolov5s.pt --img 640 --batch 1
"""

import argparse
import sys
import time

sys.path.append('./')  # to run '$ python *.py' files in subdirectories

import torch
import torch.nn as nn

import models
from models.experimental import attempt_load
from utils.activations import Hardswish, SiLU
from utils.general import set_logging, check_img_size

if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--weights', type=str, default='D:\\PythonWokspace\\JINX\\yolov5_master\\runs\\train\\exp5\\weights\\best.pt', help='weights path')  # from yolov5/models/
    parser.add_argument('--img-size', nargs='+', type=int, default=[640, 640], help='image size')  # height, width
    parser.add_argument('--batch-size', type=int, default=1, help='batch size')
    opt = parser.parse_args()
    opt.img_size *= 2 if len(opt.img_size) == 1 else 1  # expand
    print(opt)
    set_logging()
    t = time.time()

    # Load PyTorch model
    model = attempt_load(opt.weights, map_location=torch.device('cuda'))  # load FP32 model
    labels = model.names

    # Checks
    gs = int(max(model.stride))  # grid size (max stride)
    opt.img_size = [check_img_size(x, gs) for x in opt.img_size]  # verify img_size are gs-multiples

    # Input
    img = torch.zeros(opt.batch_size, 3, *opt.img_size).to(device='cuda')
    # image size(1,3,320,192) iDetection

    # Update model
    for k, m in model.named_modules():
        m._non_persistent_buffers_set = set()  # pytorch 1.6.0 compatibility
        if isinstance(m, models.common.Conv):  # assign export-friendly activations
            if isinstance(m.act, nn.Hardswish):
                m.act = Hardswish()
            elif isinstance(m.act, nn.SiLU):
                m.act = SiLU()
        # elif isinstance(m, models.yolo.Detect):
        #     m.forward = m.forward_export  # assign forward (optional)
    #model.model[-1].export = True  # set Detect() layer export=True
    model.model[-1].export = False
    y = model(img)  # dry run

    # TorchScript export
    try:
        print('\nStarting TorchScript export with torch %s...' % torch.__version__)
        f = opt.weights.replace('.pt', '.torchscript.pt')  # filename
        ts = torch.jit.trace(model, img)
        ts.save(f)
        print('TorchScript export success, saved as %s' % f)
    except Exception as e:
        print('TorchScript export failure: %s' % e)

    # ONNX export
    try:
        import onnx

        print('\nStarting ONNX export with onnx %s...' % onnx.__version__)
        f = opt.weights.replace('.pt', '.onnx')  # filename
        torch.onnx.export(model, img, f, verbose=False, opset_version=12, input_names=['images'],
                          output_names=['classes', 'boxes'] if y is None else ['output'])

        # Checks
        onnx_model = onnx.load(f)  # load onnx model
        onnx.checker.check_model(onnx_model)  # check onnx model
        # print(onnx.helper.printable_graph(onnx_model.graph))  # print a human readable model
        print('ONNX export success, saved as %s' % f)
    except Exception as e:
        print('ONNX export failure: %s' % e)

    # CoreML export
    try:
        import coremltools as ct

        print('\nStarting CoreML export with coremltools %s...' % ct.__version__)
        # convert model from torchscript and apply pixel scaling as per detect.py
        model = ct.convert(ts, inputs=[ct.ImageType(name='image', shape=img.shape, scale=1 / 255.0, bias=[0, 0, 0])])
        f = opt.weights.replace('.pt', '.mlmodel')  # filename
        model.save(f)
        print('CoreML export success, saved as %s' % f)
    except Exception as e:
        print('CoreML export failure: %s' % e)

    # Finish
    print('\nExport complete (%.2fs). Visualize with https://github.com/lutzroeder/netron.' % (time.time() - t))

4.2、GPU模型推理

如下图所示修改两个参数，‘weights’修改为【4.1】中导出的GPU模型路径；‘gpu’改为‘true’。

yolov5如何提高gpu利用率 yolov5使用gpu训练_目标检测_20

成功运行：

yolov5如何提高gpu利用率 yolov5使用gpu训练_yolov5如何提高gpu利用率_21

终于拿下啦。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：服务器证书cer配置到哪个容器里啊服务器证书是什么

下一篇：android synchronized lock android synchronized lock区别

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯