基于深度学习的图形超分辨率算法图像超分辨算法

转载

mob6454cc647bdb 2024-01-31 18:29:28

文章标签 基于深度学习的图形超分辨率算法插值双线性插值 ci 文章分类 DALL·E 2 AIGC

当前看了几种图像超分辨的方法，本篇博客主要介绍 最近邻插值算法、双线性插值算法、双三次插值算法(bicubic interpolation)、SRCNN、TNRD、ESPCN 几种方法。
为了方便归纳，这里借鉴一下其他几个博主的相关总结。。

1.最近邻插值算法、双线性插值算法、双三次插值算法(bicubic interpolation)

2.SRCNN 方法

（SRCNN就是对利用双三次插值算法降采样并恢复的图像进行 Conv（9 * 9）+relu——conv（1 * 1）+relu——conv（5*5）的操作，该过程实际上并没有改变输入和输出图像的大小，个人理解就是在双三次插值的后面加了一个三层的网络）

3.TNRD 该方法是以扩散方程（P-M方程）为基础的一种应用于Gaussian image denoising, single image super resolution， JPEG deblocking 的方法。

下面说一下个人的理解。

对于P-M扩散方程：

基于深度学习的图形超分辨率算法图像超分辨算法_插值

主要用于对实现图像的平滑。

而对于离散的P-M模型可以表示为：

基于深度学习的图形超分辨率算法图像超分辨算法_ci_02

在TNRD方法中，作者引入了 reaction term 来处理不同的图像处理问题：

基于深度学习的图形超分辨率算法图像超分辨算法_插值_03

在此基础上，得到了TNRD的扩散模型（diffusion model ）：

基于深度学习的图形超分辨率算法图像超分辨算法_插值_04

该模型可以表示为前馈网络形式：

基于深度学习的图形超分辨率算法图像超分辨算法_基于深度学习的图形超分辨率算法_05

However, we can introduce a feedback step to explicitly illustrate the special architecture of our diffusion network that we subtract “something” from the input image. Therefore, our diffusion model can be represented in a more compact way in Figure 2, where one can see that the structure of our CN model is different from conventional feed-forward networks. Due to this feedback step, it can be categorized into recurrent networks .

基于深度学习的图形超分辨率算法图像超分辨算法_双线性插值_06

在SISR中，We start with the following energy functional：

基于深度学习的图形超分辨率算法图像超分辨算法_双线性插值_07

以上就是将TNRD应用到SISR中的介绍。也就是说，TNRD以双三次插值为基础，对于每一层网络的双三次插值得到的SR图像进行散度计算求出扩散量（这个词可能不准确），然后在该层网络的SR图像ut-1中减去该扩散量得到下一次网络的输入ut。特别地，u0直接由LR图像f得到。

4.ESPCN ——Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
可以参阅博客

以及 https://www.jianshu.com/p/c24c3394cfe3

（ESPCN是一个三层的网络，前两层是卷积层，最后一层是reshape，将第二个卷积层得到的 H * W * Cr2 的图像reshape为 rH * rW * C 的图像，因此最后一层并没有进行非线性变换。）

论文：https://arxiv.org/pdf/1609.05158.pdf
代码：https://github.com/leftthomas/ESPCN

问题： ESPCN中使用的激活函数是tanh，并且证明了其比ReLU函数效果要好，why？

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。