diffusion Model原理之扩散过程与逆扩散过程

关注陈亦新

文章目录

3 diffusion models
3.1 扩散过程
3.2 逆扩散过程

diffusion Model原理之扩散过程与逆扩散过程

原创

陈亦新 2022-09-18 09:30:03 ©著作权

文章标签 算法数据分布标准差正态分布 文章分类 Spark 大数据

©著作权归作者所有：来自51CTO博客作者陈亦新的原创作品，请联系作者获取转载授权，否则将追究法律责任

前面推导了一些铺垫知识，现在正式来看diffusion Model。

3 diffusion models

diffusion Model原理之扩散过程与逆扩散过程_标准差

我们说的扩散过程，就是从 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_02$ 到 $diffusion Model原理之扩散过程与逆扩散过程_正态分布_03$ 的过程，也就是墒增的过程，从有序到无序。反过来是叫做逆扩散过程。

所以可以看到，q模型是一个加噪音的模型，p模型是一个去噪音的过程。

3.1 扩散过程

给定初始数据分布 $diffusion Model原理之扩散过程与逆扩散过程_标准差_04$ ,可以不断向分布中添加高斯噪音，该噪音的标准差是以固定值 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_05$ 而确定的，而均值是以固定值 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_05$ 和当前t时刻的 $diffusion Model原理之扩散过程与逆扩散过程_算法_07$ 决定的。这个过程是一个马尔可夫链过程。
随着t不断增大，最终数据分布 $diffusion Model原理之扩散过程与逆扩散过程_正态分布_03$ 变成了一个各向独立的高斯分布。

$diffusion Model原理之扩散过程与逆扩散过程_算法_09$

$diffusion Model原理之扩散过程与逆扩散过程_标准差_10$

这里会用到参数重整化的技巧，我们知道 $diffusion Model原理之扩散过程与逆扩散过程_算法_07$ 服从这个正态分布，所以我们从标准正态分布中采样出z，然后与 $diffusion Model原理之扩散过程与逆扩散过程_正态分布_12$ 均值相加，与 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_05$ 标准差相乘。

这里 $diffusion Model原理之扩散过程与逆扩散过程_算法_14$

这里推导一下，我们的 $diffusion Model原理之扩散过程与逆扩散过程_算法_07$ 可以表示为 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_16$ 的函数，也可以表示为 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_02$ 的函数。我们这里设定 $diffusion Model原理之扩散过程与逆扩散过程_标准差_18$

$diffusion Model原理之扩散过程与逆扩散过程_正态分布_19$

上面公式中z为正态高斯分布，且利用了参数重整化的技巧。（reparameterization trick）

$diffusion Model原理之扩散过程与逆扩散过程_数据分布_20$

$diffusion Model原理之扩散过程与逆扩散过程_数据分布_21$

两个高斯分布相加a+b，那么新分布的方差是 $diffusion Model原理之扩散过程与逆扩散过程_标准差_22$ .所以上面公式可以化简成：

$diffusion Model原理之扩散过程与逆扩散过程_标准差_23$

所以我们继续递归上面公式，可以得到： $diffusion Model原理之扩散过程与逆扩散过程_正态分布_24$

设置 $diffusion Model原理之扩散过程与逆扩散过程_算法_25$

则 $diffusion Model原理之扩散过程与逆扩散过程_标准差_26$

所以我们大概可以计算出来，当t需要多大的时候， $diffusion Model原理之扩散过程与逆扩散过程_标准差_27$ 是接近0的，就是独立同分布。

这里就可以看出来扩散模型和VAE的区别，从x到z的过程，vae是一个网络预测出来的z，而且并不能保证z和x是无关的；而扩散模型的扩散过程是一个无参的过程，并且z是一个各项同分布的一个分布，与x完全不相关。此外扩散模型的z和x是同尺寸的，而vae没有这个需求

当样本有着越来越多噪音的时候，可以采用更大的update step：

diffusion Model原理之扩散过程与逆扩散过程_数据分布_28

3.2 逆扩散过程

逆过程是从高斯噪音中恢复原始数据。

$diffusion Model原理之扩散过程与逆扩散过程_算法_29$

现在我们需要推导一下后验扩散条件概率 $diffusion Model原理之扩散过程与逆扩散过程_正态分布_30$ 。

$diffusion Model原理之扩散过程与逆扩散过程_正态分布_31$

$diffusion Model原理之扩散过程与逆扩散过程_算法_32$

因为这是马尔可夫过程，所以 $diffusion Model原理之扩散过程与逆扩散过程_算法_33$

现在我们要重点考虑这个部分：

diffusion Model原理之扩散过程与逆扩散过程_算法_34

前者是：

diffusion Model原理之扩散过程与逆扩散过程_算法_35

后者是：

diffusion Model原理之扩散过程与逆扩散过程_数据分布_36

我们只考虑指数部分，因为系数部分一定是正数，所以成正比关系。

$diffusion Model原理之扩散过程与逆扩散过程_算法_37$

$diffusion Model原理之扩散过程与逆扩散过程_算法_38$

我们要求解 $diffusion Model原理之扩散过程与逆扩散过程_数据分布_16$ ，所以将上面公式整理一下形式：

$diffusion Model原理之扩散过程与逆扩散过程_标准差_40$

后面顶不住了。。先歇着吧

赞
收藏
评论
分享
举报

上一篇：另辟蹊径的生成算法！DDPM的铺垫知识

下一篇：CLIP！文本与图像多模态预训练模型

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册