总第 137 篇文章,本文大约 1000 字,阅读大约需要 5 分钟

今天介绍的一个开源的 github 项目,主要是实现了对 GAN 训练过程的可视化代码,项目链接如下:

https://github.com/EvgenyKashin/gan-vis

 

接下来是简单介绍这份代码的情况,基本实现的功能,效果等。

前言

这是一个简单实现了学习和可视化 2d 的 GANs 的实验代码。在训练了数十个小时的 StyleGAN 后,现在可以通过快速的迭代(30s 左右)来直观的可视化一些超参数的情况(但是并不确定这种直观情况是否可以适用于更大的 GAN 模型)。主要是受到 https://poloclub.github.io/ganlab/ 的启发,但可能有人更希望在 Colab 中运行代码。

可视化

对训练的动态过程的可视化包括了:

  • 真实数据的分布情况(黑色的点)

  • 输入固定的噪音,然后由 G 网络生成的假数据;

  • D 网络对整个输入空间的决策边界,以及用不同颜色代表其输出的概率(红色代表判定为真实数据的可能性很高,蓝色则是低)

  • 绿色箭头表示每个生成的数据点,最大化 D 网络输出的方向

可视化结果

接下来是展示可视化的一些效果:

没有采用 batch-norm 的 G 和 D 的训练情况

Github项目推荐|可视化 GAN 的训练过程_python

加入 batch-norm 的 G 和 D 的训练情况

Github项目推荐|可视化 GAN 的训练过程_github_02

评价标准的可视化

第一行是训练的过程(输入是固定的噪音)以及多种评判标准(G 和 D 的梯度归一化,losses 以及 D 对真假数据的输出)。第二行展示了输入噪音以及 G 网络中间层的激活函数(映射为 2 维)

Github项目推荐|可视化 GAN 的训练过程_python_03

对输入噪音的 G 网络的转换

Github项目推荐|可视化 GAN 的训练过程_数据_04

可调试的选项

  • 输入数据的分布

  • batch 大小,训练的 epochs

  • D 和 G 的学习率(可能是最重要的)

  • D 和 G 的优化器

  • 输入噪音的分布

  • 神经元的数量,激活函数

  • 损失函数(BCE,L2)

  • 权重初始化

  • 正则化(batch-norm,dropout,权重衰减)

采用的是 CPU,因为对可视化的实验已经满足速度的要求。

未来的工作

  • 增加更多的损失函数

  • 增加更多的正则化技术

项目代码可以直接访问 github 查看,或者关注我的公众号--【算法猿的成长】,在后台回复“play_gans",获取代码。


精选AI文章

1.  2020年计算机视觉学习指南

2. 是选择Keras还是PyTorch开始你的深度学习之旅呢?

3. 编写高效的PyTorch代码技巧(上)

4. 编写高效的PyTorch代码技巧(下)

5. 深度学习算法简要综述(上)

6. 深度学习算法简要综述(下)

7. 10个实用的机器学习建议

8. 实战|手把手教你训练一个基于Keras的多标签图像分类器

精选python文章

1.  python数据模型

2. python版代码整洁之道

3. 快速入门 Jupyter notebook

4. Jupyter 进阶教程

5. 10个高效的pandas技巧

精选教程资源文章

1. [资源分享] TensorFlow 官方中文版教程来了

2. [资源]推荐一些Python书籍和教程,入门和进阶的都有!

3. [Github项目推荐] 推荐三个助你更好利用Github的工具

4. Github上的各大高校资料以及国外公开课视频

5. GitHub上有哪些比较好的计算机视觉/机器视觉的项目?

欢迎关注我的微信公众号--算法猿的成长,或者扫描下方的二维码,大家一起交流,学习和进步!

  Github项目推荐|可视化 GAN 的训练过程_计算机视觉_05