pytorch生成对抗网络编程下载生成对抗网络代码pytorch

转载

mob6454cc70a873 2024-01-11 14:48:54

文章标签 pytorch生成对抗网络编程下载 python 机器学习人工智能深度学习 文章分类 stable diffusion AIGC

2014年，Ian Goodfellow 和他在蒙特利尔大学的同事们发表了一篇令人惊叹的论文，向世界介绍了 GANs)，即生成对抗性网络。通过计算图和博弈论的创新组合，他们表明，如果给予足够的建模能力，两个互相攻击的模型将能够通过普通的反向传播进行协同训练。

模型扮演着两种截然不同的角色。给定一些真实的数据集 R，G 是生成器，试图生成看起来像真实数据的假数据，而 D 是鉴别器，从真实数据集或 G 中获取数据并标记差异。Goodfellow 比喻(这是一个很好的比喻)：G 就像一个伪造者的团队，试图根据他们的输出匹配真实的数据，而 D 是一个侦探团队，试图分辨其中的差异。(只是在这种情况下，伪造者 G 永远看不到原始数据ーー只能看到 D 的判断，他们就像盲目的伪造者。)

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_深度学习

在理想情况下，随着时间的推移，D 和 G 都会变得更好，直到 G 基本上成为真正文章的“大师伪造者”，D 感到茫然，“无法区分这两种分布”。

实际上，Goodfellow 展示的是 G 可以在原始数据集上执行一个非监督式学习/数据集的形式，找到以一种更低维度的方式来表示数据的方法。正如 Yann LeCun 的名言所说：unsupervised learning is the “cake” of true AI。

这个强大的技术看起来需要大量的代码才能开始，对吧？没有。使用 PyTorch，我们实际上可以用不到50行代码创建一个非常简单的 GAN。实际上只有5个部分需要考虑：

R：原始的、真实的数据集
I：进入发生器的随机噪声
G：试图复制/模拟原始数据集的生成器
D：试图分辨生成器G的输出和真实数据R的鉴别器
实际的“训练”的循环，使得生成器G能够骗过鉴别器D，同时D能提防G。

1) R: 在我们的例子中，我们将从最简单的 R ー a bell curve 开始。这个函数取一个平均值和一个标准差，然后返回一个函数，这个函数用这些参数从高斯函数中提供正确的样本数据尺寸。在我们的示例代码中，我们将使用4.0的平均值和1.25的标准差。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_人工智能_02

2) I: 生成器的输入也是随机的，但是为了让我们的工作更难一点，我们使用一个统一的分布，而不是一个正常的分布。这意味着我们的模型 G 不能简单地 shift/scale 的方式复制 R，而必须以非线性的方式对数据进行处理。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_pytorch生成对抗网络编程下载_03

3) G: 生成器是一个标准的前向图：两个隐藏层，三个线性映射。我们使用双曲正切激活函数。G 将从 I 中得到均匀分布的数据样本，并以某种方式模拟从 R ー中得到的正态分布的样本，而不会看到 R。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_pytorch生成对抗网络编程下载_04

4) D: 鉴别器代码非常类似于 G 的生成器代码：一个有两个隐藏层和三个线性映射的前向图。这里的激活函数是 sigmoid。它将从 R 或 G 中获取样本，然后输出一个介于0到1之间的数值，被解释为“假的”或“真的”。换句话说，这大概是神经网络所基本能做到的。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_pytorch生成对抗网络编程下载_05

5) 最后，训练循环在两种模式之间交替进行：首先在真实数据和虚假数据中训练 D；然后训练 G 愚弄 D。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_python_06

即使你以前没有使用过 PyTorch，你也可能从代码结构中看出发生了什么。在第一部分(绿色)中，我们将这两种类型的数据推送到 D 中，并对 D 的猜测与实际的标签应用一个可区分的标准。这个推进就是“forward”步骤；然后我们显式地调用“backward()”以便计算梯度，然后在 d_optimizer.step() 调用中使用梯度来更新 D 的参数。使用 G，但不在这里训练。

然后在最后(红色)部分，我们对 G 做类似的操作（注意，我们也通过 D 运行 G 的输出），但是我们在这一步没有优化或改变 D。我们不希望 D 记错标签。因此，我们只调用 g_optimizer.step()。

在 D 和 G 之间进行了几千次这种“交手”之后，我们得到了什么？鉴别器 D 很快就好了(而 G 缓慢上升) ，但一旦它达到一定的能力水平，才会真正开始改善。

超过5000轮训练后，D 被训练了20次，然后在每轮训练 G 20次，G 的输出的平均值超过4.0，然后回落到一个相对稳定，正确的范围(左)。同样地，标准差最初下降到错误的方向，但随后上升到理想的1.25范围(右) ，与 R 相匹配。

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_机器学习_07

好了，基本的统计数据最终与 R 匹配。？分布的形状看起来正确吗？毕竟，你当然可以得到一个平均值为4.0，平均标准差为1.25的均匀分布，但这不会真正匹配 R。让我们看看 G 发出的最终分布：

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_深度学习_08

生成器G几乎完美地恢复原始数据的分布R - 并且鉴别器D在角落里畏缩，对自己喃喃自语，无法从中“说出”事实。这正是我们想要的结果，这里总共才不到50行代码。

提示：GAN很挑剔，而且很脆弱。当它们进入奇怪的状态时，往往不会在没有一点哄骗的情况下出来。运行示例代码十次（每次超过5,000轮）显示以下 10 个分布：

pytorch生成对抗网络编程下载生成对抗网络代码pytorch_深度学习_09

如上图所示，10 次运行中，有 8 次可以得到比较不错的分布：类似于高斯分布。但其中两次没有生成这样的分布。在一种情况下（第5次运行），有一个凹面分布，平均值约为6.0，在最后一次运行中，在-11处有一个狭窄的峰值！当您开始在几乎任何环境中应用 GAN 时，您会看到这种现象：GAN 并不像监督学习工作流程那样稳定。但是当它们工作时，它们看起来非常不可思议。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。