阅读论文:MSG-GAN: Multi-Scale Gradients for Generative Adversarial Networks

MSG-GAN,高分辨率图像生成,训练策略。
代码https://github.com/akanimax/msg-stylegan-tf
问题:1.模式崩溃(当生成器网络仅能够捕获数据分布中存在方差的子集时,就会发生模式坍塌的问题。)。2.训练不稳定(由于当真实和虚假的分布空间之间存在实质性的重叠时,从判别器到生成器的随机(非信息性)梯度传递导致的)。
优势:解决GAN训练不稳定的问题。避免跨多尺度生成的图像需要显式的颜色一致性正则化项(多尺度下一般是需要的)。对超参数不敏感。
架构:应用于两个基本架构ProGAN和Style-GAN(除混合正则化)。

损失:ProGAN(WGAN-GP)和Style-GAN(1-sided GP的非饱和GAN损失)
实验细节:使用相同的初始潜在维数 512,从标准正态分布 N(0,I)提取,然后进行超球面归一化。超参数相同(lr=0.003)。还扩展了MinBatchStdDev 技术,将一批激活的平均标准偏差馈送到判别器,以改善样本多样性。
结果

稳定性:对所有分辨率均收敛,在每种分辨率下同时发生训练迭代。具有高稳定性,有助于压缩训练时间。

学习率鲁棒性:学习率并不很大的影响。
消融:多尺度梯度连接,连接函数的变体。
局限和未来工作:1.使用渐进式训练,以较低的分辨率进行的第一组迭代要快得多,而 MSG-GAN 的每次迭代花费的时间相同。2.在 FFHQ 和 CelebA-HQ 的面部数据集上,我们没有超过 StyleGAN 的生成质量。3.在 MSG-StyleGAN 中进行了多尺度修改,无法利用混合正则化技巧。