图像超分辨率之ESPCN(Efficient Sub-Pixel Convolutional Neural Network)

2023-12-18 15:55:40

cvpr2016
论文下载：Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network
代码：https://github.com/leftthomas/ESPCN

1.结构

在这里插入图片描述 ESPCN的核心概念是亚像素卷积层(sub-pixel convolutional layer)。网络的输入是原始低分辨率图像，通过三个卷积层以后，得到通道数为放大倍数的立方的与输入图像大小一样的特征图像。再将特征图像每个像素的个通道重新排列成一个的区域，对应高分辨率图像中一个大小的子块，从而大小为的特征图像被重新排列成的高分辨率图像。我理解的亚像素卷积层包含两个过程，一个普通的卷积层和后面的排列像素的步骤。就是说，最后一层卷积层输出的特征个数需要设置成固定值，即放大倍数r的平方，这样总的像素个数就与要得到的高分辨率图像一致，将像素进行重新排列就能得到高分辨率图.
ESPCN的核心概念是亚像素卷积层(sub-pixel convolutional layer)。如上图所示，网络的输入是原始低分辨率图像，通过两个卷积层以后，得到的特征图像大小与输入图像一样，但是特征通道为 $r^2$ (r是图像的目标放大倍数)。将每个像素的 $r^2$ 个通道重新排列成一个 $r \times r$ 的区域，对应于高分辨率图像中的一个 $r \times r$ 大小的子块，从而大小为 $r^2×H×W$ 的特征图像被重新排列成 $1 \times rH \times r W$ 大小的高分辨率图像。这个变换虽然被称作sub-pixel convolution, 但实际上并没有卷积操作。

也是一种后上采样的方法，速度十分的快。
在这里插入图片描述
看代码更清楚一些：

class espc(nn.Module):
    def __init__(self, upscale_factor,in_channel):
        super(espc, self).__init__()

        self.conv1 = conv2d(1*in_channel, 1*in_channel, 5, 1, pad=2)
        self.conv2 = conv2d(1*in_channel, 1*in_channel, 3, 1, pad=1)
        self.conv3 = conv2d(1*in_channel, 1*in_channel*(upscale_factor ** 2), 3, 1, pad=1)
        self.pixel_shuffle = nn.PixelShuffle(upscale_factor)

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        x = self.conv3(x)        
        x = F.sigmoid(self.pixel_shuffle(x))
        return x

2.实验

voc+coco预训练+yolov3+loss3.874+915但是已经停止收敛了：
请添加图片描述

请添加图片描述
srcnn915依旧有着收敛的趋势：

请添加图片描述
935&EPOCH58已经收敛了：

ESPCN：

文章来源:https://blog.csdn.net/qq_41950533/article/details/121419174
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！