机器学习自造训练数据集的注意事项

转载

mob6454cc786d85 2024-08-17 09:44:48

文章标签 机器学习自造训练数据集的注意事项深度学习 pytorch python 图像处理 文章分类 机器学习人工智能

总结了使用CycleGAN训练自己制作的数据集，这里的教程例子主要就是官网给出的斑马变马，马变斑马，两个不同域之间的相互转换。教程中提供了官网给的源码包和我自己调试优化好的源码包，大家根据自己的情况下载使用，推荐学习者下载我提供的源码包，可以少走一些弯路，按照我的教程，能较快上手训练使用。

一、源码包的下载

官方给出的源码包下载链接：CycleGAN官网

机器学习自造训练数据集的注意事项_深度学习

配套教程源码包下载方法，文章末扫码到公众号中回复关键字：CycleGAN。获取下载链接。

下载好配套教程的源码包解压后的样纸见下：

机器学习自造训练数据集的注意事项_深度学习_02

注：如果是下载官网提供源码包的童鞋，在下载后的根目录中创建两个文件，分别是：checkpoints文件（用于存放训练好的模型权重文件）和results文件（用于存放测试后结果）。

二、安装训练必要的库文件

Python的版本选用3.7或者3.8都可以。

机器学习自造训练数据集的注意事项_python_03

三、准备数据集

准备数据集数据集可以是自己准备的，也可以下载官网提供的，下载官网提供的数据集链接为：数据集下载，如下面的样纸，打开链接后直接点击即可下载数据集，在我提供的源码包中，我已经下载了horse2zebra.zip，后面的教程也都是基于此数据集讲解的。

机器学习自造训练数据集的注意事项_图像处理_04

下载解压后将文件复制到根目录datasets文件中，如下：

机器学习自造训练数据集的注意事项_pytorch_05

训练集里面的样纸见下，如果是用自己数据集的童鞋，将两个不同域的图像，分别复制到对应的测试集里面和训练集里面。

机器学习自造训练数据集的注意事项_深度学习_06

下面是补充解释上面对应的A域，B域各对应着的类别：

机器学习自造训练数据集的注意事项_pytorch_07

四、训练数据集

1、配置训练文件

在正式训练前，需要在编译软件中配置训练文件，我这里提供的配置方法是在Pycharm编译软件中，其它编译软件的配置方法也类似，具体配置方法见下：

（1）先运行一下train.py文件，这时候会报错提示，提示需要配置训练文件，如下：

机器学习自造训练数据集的注意事项_pytorch_08

报错的提示如下：error: the following arguments are required: --dataroot

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_09

（2）打开Run的下拉菜单，点击Edit Configurations，如下：

机器学习自造训练数据集的注意事项_深度学习_10

机器学习自造训练数据集的注意事项_pytorch_11

如上图所示，在打开的编辑框中输入如下命令后点击OK即可添加好训练配置文件：

机器学习自造训练数据集的注意事项_深度学习_12

2、训练参数的修改

下面的参数童鞋根据自己的电脑配置自行修改

（1）训练轮数epoch，修改位置见下：

机器学习自造训练数据集的注意事项_pytorch_13

(2) 一次喂入图片数量，即batch_size的修改，由于CycleGAN网络特别复杂，训练占用的显存特别大，电脑配置一般的话建议改为1就可以，如果你的电脑显存为8G，参数改为2，见下：

机器学习自造训练数据集的注意事项_深度学习_14

下图是我自己电脑显存的使用情况，我电脑显存为8G，batch_size参数为2，大家参考我的电脑配置自行修改训练参数：

机器学习自造训练数据集的注意事项_python_15

3、开始训练

上面步骤都准备好后在Terminal控制台中输入下面命令回车就开始训练了，如下：

python train.py --dataroot ./datasets/horse2zebra --name horse2zebra_cyclegan --model cycle_gan

机器学习自造训练数据集的注意事项_图像处理_16

回车后下面这种样纸的情况，就说明在正常训练了：

机器学习自造训练数据集的注意事项_深度学习_17

4、可视化训练过程

使用visdom可视化训练过程。安装好visdom这个库后，进入到库所在的文件夹中，打开文件server.py文件，注释一行里面的代码，防止每次打开visdom时都自动连外网更新，见下：

机器学习自造训练数据集的注意事项_python_18

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_19

4.1 启动visdom

先进入虚拟环境中，输入下面命令后，复制输出的网址到浏览器中就可以实时观看CycleGAN网络的预测结果了，也可以实时看到loss值的变换情况，见下：

python -m visdom.server

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_20

机器学习自造训练数据集的注意事项_图像处理_21

五、测试训练好的模型

1、配置测试文件

上面的训练很漫长，等待全部训练完后就可以开始测试训练好的模型了，上面训练好的模型，存放在根目录文件夹checkpoints中，如下：

机器学习自造训练数据集的注意事项_图像处理_22

同样类似上面的方法，配置测试文件，先运行以下test.py文件，同样也会报错提示，如下：

机器学习自造训练数据集的注意事项_pytorch_23

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_24

开始配置测试文件：

机器学习自造训练数据集的注意事项_pytorch_25

机器学习自造训练数据集的注意事项_pytorch_26

机器学习自造训练数据集的注意事项_深度学习_27

复制权重文件到新建的文件夹horse2zebra_pretrained中，并将复制过来的权重文件名字改为latest_net_G.pth，如下：

机器学习自造训练数据集的注意事项_python_28

2、开始测试

在Terminal控制台中输入以下命令，并回车就开始测试了，如下：

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra_pretrained --model test --no_dropout

机器学习自造训练数据集的注意事项_图像处理_29

出现下面的样纸时就说明测试完成了，测试的最后结果会保存到根目录下的results这个文件夹中，见下：

机器学习自造训练数据集的注意事项_pytorch_30

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_31

以上就是使用CycleGAN网络训练自己数据集，并测试最终模型的过程。

六、测试官方给出的模型权重

当然有的童鞋懒得训练也可以使用官方已经训练好的模型权重文件，下载官方给的模型权重文件链接为：官网提供的模型权重，如下：

机器学习自造训练数据集的注意事项_python_32

直接点击下载好后复制到根目录下的checkpoints文件下，新建一个文件夹，再将权重文件复制进去新建的文件夹中，如下：

机器学习自造训练数据集的注意事项_深度学习_33

最后测试之前先修改test.py的配置文件，具体操作同上，如下：

机器学习自造训练数据集的注意事项_pytorch_34

机器学习自造训练数据集的注意事项_pytorch_35

最后在Terminal控制台中输入以下命令回车后，即可测试模型权重的训练结果，最后测试的图像结果保存位置也是在根目录下的results文件夹中，见下：

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra.pth_pretrained --model test --no_dropout

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_36

机器学习自造训练数据集的注意事项_python_37

七、总结

以上就是使用CycleGAN训练自己制作的数据集，快速上手的通俗教程，也提供了直接下载官方提供模型权重文件的使用方法，希望我总结的教程能帮到你快速上手使用。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：香橙派安装android 香橙派怎么安装系统

下一篇：widnows上的rsync卸载 rsync删除文件原理

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯