总结了使用CycleGAN训练自己制作的数据集,这里的教程例子主要就是官网给出的斑马变马,马变斑马,两个不同域之间的相互转换。教程中提供了官网给的源码包和我自己调试优化好的源码包,大家根据自己的情况下载使用,推荐学习者下载我提供的源码包,可以少走一些弯路,按照我的教程,能较快上手训练使用。

目录

  • 一、源码包的下载
  • 二、安装训练必要的库文件
  • 三、准备数据集
  • 四、训练数据集
  • 1、配置训练文件
  • 2、训练参数的修改
  • 3、开始训练
  • 4、可视化训练过程
  • 4.1 启动visdom
  • 五、测试训练好的模型
  • 1、配置测试文件
  • 2、开始测试
  • 六、测试官方给出的模型权重
  • 七、总结

一、源码包的下载

官方给出的源码包下载链接:CycleGAN官网

机器学习自造训练数据集的注意事项_深度学习

配套教程源码包下载方法,文章末扫码到公众号中回复关键字:CycleGAN。获取下载链接。

下载好配套教程的源码包解压后的样纸见下:

机器学习自造训练数据集的注意事项_深度学习_02

注:如果是下载官网提供源码包的童鞋,在下载后的根目录中创建两个文件,分别是:checkpoints文件(用于存放训练好的模型权重文件)和results文件(用于存放测试后结果)。

二、安装训练必要的库文件

Python的版本选用3.7或者3.8都可以。

机器学习自造训练数据集的注意事项_python_03

三、准备数据集

准备数据集 数据集可以是自己准备的,也可以下载官网提供的,下载官网提供的数据集链接为:数据集下载,如下面的样纸,打开链接后直接点击即可下载数据集,在我提供的源码包中,我已经下载了horse2zebra.zip,后面的教程也都是基于此数据集讲解的。

机器学习自造训练数据集的注意事项_图像处理_04

下载解压后将文件复制到根目录datasets文件中,如下:

机器学习自造训练数据集的注意事项_pytorch_05

训练集里面的样纸见下,如果是用自己数据集的童鞋,将两个不同域的图像,分别复制到对应的测试集里面和训练集里面。

机器学习自造训练数据集的注意事项_深度学习_06

下面是补充解释上面对应的A域,B域各对应着的类别:

机器学习自造训练数据集的注意事项_pytorch_07

四、训练数据集

1、配置训练文件

在正式训练前,需要在编译软件中配置训练文件,我这里提供的配置方法是在Pycharm编译软件中,其它编译软件的配置方法也类似,具体配置方法见下:

(1)先运行一下train.py文件,这时候会报错提示,提示需要配置训练文件,如下:

机器学习自造训练数据集的注意事项_pytorch_08

报错的提示如下:error: the following arguments are required: --dataroot

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_09

(2)打开Run的下拉菜单,点击Edit Configurations,如下:

机器学习自造训练数据集的注意事项_深度学习_10

机器学习自造训练数据集的注意事项_pytorch_11

如上图所示,在打开的编辑框中输入如下命令后点击OK即可添加好训练配置文件:

机器学习自造训练数据集的注意事项_深度学习_12

2、训练参数的修改

下面的参数童鞋根据自己的电脑配置自行修改

(1)训练轮数epoch,修改位置见下:

机器学习自造训练数据集的注意事项_pytorch_13

(2) 一次喂入图片数量,即batch_size的修改,由于CycleGAN网络特别复杂,训练占用的显存特别大,电脑配置一般的话建议改为1就可以,如果你的电脑显存为8G,参数改为2,见下:

机器学习自造训练数据集的注意事项_深度学习_14

下图是我自己电脑显存的使用情况,我电脑显存为8G,batch_size参数为2,大家参考我的电脑配置自行修改训练参数:

机器学习自造训练数据集的注意事项_python_15

3、开始训练

上面步骤都准备好后在Terminal控制台中输入下面命令回车就开始训练了,如下:

python train.py --dataroot ./datasets/horse2zebra --name horse2zebra_cyclegan --model cycle_gan

机器学习自造训练数据集的注意事项_图像处理_16

回车后下面这种样纸的情况,就说明在正常训练了:

机器学习自造训练数据集的注意事项_深度学习_17

4、可视化训练过程

使用visdom可视化训练过程。安装好visdom这个库后,进入到库所在的文件夹中,打开文件server.py文件,注释一行里面的代码,防止每次打开visdom时都自动连外网更新,见下:

机器学习自造训练数据集的注意事项_python_18

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_19

4.1 启动visdom

先进入虚拟环境中,输入下面命令后,复制输出的网址到浏览器中就可以实时观看CycleGAN网络的预测结果了,也可以实时看到loss值的变换情况,见下:

python -m visdom.server

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_20

机器学习自造训练数据集的注意事项_图像处理_21

五、测试训练好的模型

1、配置测试文件

上面的训练很漫长,等待全部训练完后就可以开始测试训练好的模型了,上面训练好的模型,存放在根目录文件夹checkpoints中,如下:

机器学习自造训练数据集的注意事项_图像处理_22

同样类似上面的方法,配置测试文件,先运行以下test.py文件,同样也会报错提示,如下:

机器学习自造训练数据集的注意事项_pytorch_23

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_24

开始配置测试文件:

机器学习自造训练数据集的注意事项_pytorch_25

机器学习自造训练数据集的注意事项_pytorch_26

机器学习自造训练数据集的注意事项_深度学习_27

复制权重文件到新建的文件夹horse2zebra_pretrained中,并将复制过来的权重文件名字改为latest_net_G.pth,如下:

机器学习自造训练数据集的注意事项_python_28

2、开始测试

在Terminal控制台中输入以下命令,并回车就开始测试了,如下:

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra_pretrained --model test --no_dropout

机器学习自造训练数据集的注意事项_图像处理_29

出现下面的样纸时就说明测试完成了,测试的最后结果会保存到根目录下的results这个文件夹中,见下:

机器学习自造训练数据集的注意事项_pytorch_30

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_31

以上就是使用CycleGAN网络训练自己数据集,并测试最终模型的过程。

六、测试官方给出的模型权重

当然有的童鞋懒得训练也可以使用官方已经训练好的模型权重文件,下载官方给的模型权重文件链接为:官网提供的模型权重,如下:

机器学习自造训练数据集的注意事项_python_32

直接点击下载好后复制到根目录下的checkpoints文件下,新建一个文件夹,再将权重文件复制进去新建的文件夹中,如下:

机器学习自造训练数据集的注意事项_深度学习_33

最后测试之前先修改test.py的配置文件,具体操作同上,如下:

机器学习自造训练数据集的注意事项_pytorch_34

机器学习自造训练数据集的注意事项_pytorch_35

最后在Terminal控制台中输入以下命令回车后,即可测试模型权重的训练结果,最后测试的图像结果保存位置也是在根目录下的results文件夹中,见下:

python test.py --dataroot datasets/horse2zebra/testA --name horse2zebra.pth_pretrained --model test --no_dropout

机器学习自造训练数据集的注意事项_机器学习自造训练数据集的注意事项_36

机器学习自造训练数据集的注意事项_python_37

七、总结

以上就是使用CycleGAN训练自己制作的数据集,快速上手的通俗教程,也提供了直接下载官方提供模型权重文件的使用方法,希望我总结的教程能帮到你快速上手使用。