1200字范文 > 深度卷积对抗生成网络(DCGAN)

深度卷积对抗生成网络(DCGAN)

时间：2021-10-04 05:51:24

相关推荐

深度卷积对抗生成网络(DCGAN)

本文是参考文献[1]的论文笔记。

卷积神经网络在有监督学习中的各项任务上都有很好的表现，但在无监督学习领域，却比较少。本文介绍的算法将有监督学习中的CNN和无监督学习中的GAN结合到了一起。

在非CNN条件下，LAPGAN在图像分辨率提升领域也取得了好的效果。

与其将本文看成是CNN的扩展，不如将其看成GAN的扩展到CNN领域。而GAN的基本算法，可以参考对抗神经网络。

GAN无需特定的cost function的优势和学习过程可以学习到很好的特征表示，但是GAN训练起来非常不稳定，经常会使得生成器产生没有意义的输出。而论文的贡献就在于：

为CNN的网络拓扑结构设置了一系列的限制来使得它可以稳定的训练。使用得到的特征表示来进行图像分类，得到比较好的效果来验证生成的图像特征表示的表达能力对GAN学习到的filter进行了定性的分析。展示了生成的特征表示的向量计算特性。

模型结构

模型结构上需要做如下几点变化：

将pooling层convolutions替代，其中，在discriminator上用strided convolutions替代，在generator上用fractional-strided convolutions替代。在generator和discriminator上都使用batchnorm。解决初始化差的问题帮助梯度传播到每一层防止generator把所有的样本都收敛到同一个点。直接将BN应用到所有层会导致样本震荡和模型不稳定，通过在generator输出层和discriminator输入层不采用BN可以防止这种现象。移除全连接层 global pooling增加了模型的稳定性，但伤害了收敛速度。在generator的除了输出层外的所有层使用ReLU，输出层采用tanh。在discriminator的所有层上使用LeakyReLU。

DCGAN的generator网络结构：

其中，这里的conv层是four fractionally-strided convolution，在其他的paper中也可能被称为是deconvolution.

训练细节

预处理环节，将图像scale到tanh的[-1, 1]。mini-batch训练，batch size是128.所有的参数初始化由(0, 0.02)的正态分布中随即得到LeakyReLU的斜率是0.2.虽然之前的GAN使用momentum来加速训练，DCGAN使用调好超参的Adam optimizer。learning rate=0.0002将momentum参数beta从0.9降为0.5来防止震荡和不稳定。