扩散生成模型如何用于分类任务中扩散模型公式

转载

mob64ca14068b0b 2024-08-23 07:26:56

文章标签 扩散生成模型如何用于分类任务中扩散模型生成模型数据分布最小化 文章分类 计算机视觉人工智能

一扩散模型原理记录

以下内容为对上述资料的补充理解，理解不对的地方，请多指教。

以下序号与资料中的章节序号一致。

七、目标数据分布的似然函数

扩散模型本质为生成模型，所以最本质的目标是最大化对数据分布真值的预测概率。

这里可以假设成一个分类问题，不同的类别表示不同的数据分布，其中包括与数据分布真值相近的和不相近的。模型会预测不同数据分布的概率。我们的目标是，使网络对数据分布真值对应的类别的预测概率最高。

用公式表示： $扩散生成模型如何用于分类任务中扩散模型公式_生成模型$ ，其中， $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_02$ 为模型对数据分布真值预测的概率分布（注意模型不只是网络，在扩散模型里，网络是模型的一部分，模型还包括对网络输出结果的后处理，因此网络输出值可能多种多样）。

但是 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_02$ 范围是 $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_04$ ，直接最大化不好计算，因此一般转化为最小化对数似然函数： $扩散生成模型如何用于分类任务中扩散模型公式_最小化_05$ 。直接最小化 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_05$ 也不好求，所以扩散模型转而最小化 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_05$ 的上界，这个上界就是 $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_08$ （需要乘 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_09$ ）。

下面的目标就是最小化 $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_10$ 。

$扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_08$ 最终转化为 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_12$ （ $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_13$ 与 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_14$ 合并到一起了），其中， $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_15$ 和 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_14$ 都是两个高斯分布的KL散度，结果只与两个高斯分布的均值和方差有关。 $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_15$ 中两个分布的均值和方差都是已知(在 $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_18$ 分布已知的情况下已知)且不可优化的，因此直接去除。下面计算 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_14$ ，如下式（方差是设定的固定值，所以省略了）：

扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_20

其中， $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_21$ 是 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_22$ 高斯分布的均值， $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_23$ 是 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_24$ 高斯分布的均值。

$扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_25$ 是模型的预测分布，也可以写成 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_26$ 。

对上式展开，其中 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_22$ 的均值 $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_21$ 已经在前面计算出来了，直接代入：

扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_29

上式中 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_30$ 与上文的 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_31$ 一样，都是加的噪声。下面的问题是，我们要最小化 $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_32$ ，网络在模型中扮演什么角色？可选择的是：

预测 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_33$ ，使其逼近 $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_34$ ，即损失是他俩的差；
预测 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_35$ ，使其直接逼近 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_36$ ，损失是他俩的差；
预测 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_37$ ，这样 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_38$ 分布的均值 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_33$ 就与 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_40$ 的均值公式一样，即下式。这样就可以逼近 $扩散生成模型如何用于分类任务中扩散模型公式_数据分布_34$ ，即损失是他俩的差（可以简化计算）；

扩散生成模型如何用于分类任务中扩散模型公式_最小化_42

扩散模型的作者选择用网络来预测 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_30$ ，这样， $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_23$ 的计算公式如下：

扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_45

再简化 $扩散生成模型如何用于分类任务中扩散模型公式_扩散生成模型如何用于分类任务中_46$ ，如下：

扩散生成模型如何用于分类任务中扩散模型公式_数据分布_47

到这里，网络的损失就确定了，即最小化预测的噪声与实际添加的噪声的差，网络输入是时刻t和时刻t对应的xt。

有了网络输出的噪声后，就可以通过 $扩散生成模型如何用于分类任务中扩散模型公式_最小化_48$ 分布的均值 $扩散生成模型如何用于分类任务中扩散模型公式_扩散模型_23$ 和方差（方差是预定义的 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_50$ ）来采样出 $扩散生成模型如何用于分类任务中扩散模型公式_生成模型_51$ ，训练过程和反扩散过程的伪代码如下：