Tic商业评论

关注微信公众号【站长自定义模块】,定时推送前沿、专业、深度的商业资讯。

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫码,快速开始

深度学习
    GAN — Stacked生成对抗网络 (SGAN)

    GAN — Stacked生成对抗网络 (SGAN)

    lijingle2022-1-9 16:24
    在本文中,我们将研究 SGAN 的细节,它在 GAN 中产生了一些最高的图像质量。 堆叠生成对抗网络(SGAN)由编码器 y = E(x),其中 x 是图像,y 是其标签,并且解码器 x = G(y, z) 其中 z 是噪声。此处的解码器充当 GAN ...
    GAN — CGAN & InfoGAN(使用标签改进 GAN)

    GAN — CGAN & InfoGAN(使用标签改进 GAN)

    lijingle2022-1-9 15:45
    在判别模型(如分类)中,我们手工制作特征以使模型表现更好。 如果模型有足够的容量并且知道如何自己学习这些特征,则不需要这种做法。 在 GAN 中,训练模型非常重要。 它可以从标签中获得额外的帮助,以使模型表现 ...
    GAN — DCGAN(深度卷积生成对抗网络)

    GAN — DCGAN(深度卷积生成对抗网络)

    lijingle2022-1-9 15:32
    DCGAN 是 GAN 中流行且成功的网络设计之一。 它主要由没有最大池化或全连接层的卷积层组成。 它使用卷积步幅和转置卷积进行下采样和上采样。 下图是生成器的网络设计。以下是 DCGAN 的总结:用卷积步幅替换所有最大 ...
    GAN — 提高 GAN 性能的方法

    GAN — 提高 GAN 性能的方法

    lijingle2022-1-9 12:14
    与其他深度网络相比,GAN 模型在以下情况可能会受到严重影响。不收敛:模型不收敛,更糟糕的是它们变得不稳定。模式崩溃:生成器产生有限的模式,并且慢速训练:训练生成器的梯度消失了。作为 GAN 文章的一部分,本 ...
    证明(GAN 最佳点)

    证明(GAN 最佳点)

    lijingle2022-1-8 20:13
    我们已经提到优化 GAN 就是优化 JS-divergence。 这在cost函数中并不明显:我们将在此证明,同时证明对应的最优点为:p = q,鉴别器无法区分真假 D*(x) = 1/2,V* = -2 log2。证明:如果 G 是固定的,则最优判别器 D* ...
    GAN——为什么生成对抗网络非常困难!

    GAN——为什么生成对抗网络非常困难!

    lijingle2022-1-8 20:03
    识别莫奈的画比画一幅画更容易。 与判别模型(处理数据)相比,生成模型(创建数据)被认为更难。 训练 GAN 也很困难。 本文是 GAN 系列的一部分,将介绍为什么训练很难。 通过研究,我们了解了一些推动许多研究人员 ...
    GAN — Super Resolution GAN (SRGAN)

    GAN — Super Resolution GAN (SRGAN)

    lijingle2022-1-6 19:22
    超分辨率 GAN 应用深度网络与对抗网络相结合来生成更高分辨率的图像。 如上所示,与没有 GAN 的类似设计(SRResNet)相比,SRGAN 对具有更多细节的人类更具吸引力。 在训练期间,高分辨率图像 (HR) 被下采样为低分辨 ...
    GAN — CycleGAN(用图片玩魔术)

    GAN — CycleGAN(用图片玩魔术)

    lijingle2022-1-6 19:03
    许多 GAN 研究侧重于模型收敛和模式崩溃。 我们处理博弈,我们不知道如何有效解决它。 但是 GAN 可以很有趣,特别是对于跨域转化。 CycleGAN 将样式转移到图像。 例如,我们从收集三组图片开始:一组是真实的风景, ...
    GAN — 如何衡量 GAN 的性能?

    GAN — 如何衡量 GAN 的性能?

    lijingle2022-1-6 12:30
    在 GAN 中,生成器和鉴别器的目标函数通常衡量它们相对于对手的表现。 例如,我们测量生成器愚弄鉴别器的程度。 它不是衡量图像质量或其多样性的好指标。 作为 GAN 系列的一部分,我们研究了如何比较不同 GAN 模型的 ...
    GAN — GAN 的一些比较好的应用

    GAN — GAN 的一些比较好的应用

    lijingle2022-1-4 21:23
    在 GAN 发展的最初几年取得了令人瞩目的进展。 没有更多像恐怖电影中的邮票大小的面部照片。 2017 年,GAN 制作了 1024 × 1024 的图像,可以骗过星探。在未来几年,我们可能会看到由 GAN 生成的高质量视频。 商业应 ...
    GAN——对 GAN 网络的全面总结(1)

    GAN——对 GAN 网络的全面总结(1)

    lijingle2022-1-4 21:04
    在这个 GAN 系列中,我们确定了 GAN 如何应用于深度学习问题的一般模式,并研究了 GAN 为何如此难以训练的问题。 我们还查看了一些潜在的解决方案。 通过在一个上下文中回顾它们,让我们了解 GAN 研究的动机和方向以 ...
    IOU (Intersection over Union)

    IOU (Intersection over Union)

    lijingle2022-1-3 19:07
    什么是IOU,用在什么地方?IOU(Intersection over Union)是一个术语,用于描述两个框的重叠程度。 重叠区域越大,IOU 越大。IOU 主要用于与物体检测相关的应用中,我们训练一个模型来输出一个完美地围绕一个物体的 ...
    边界框的基础知识

    边界框的基础知识

    lijingle2022-1-3 15:57
    什么是边界框?边界框本质上是一个围绕对象的矩形,它指定了它的位置、类别(例如:汽车、人)和置信度(它在该位置的可能性)。 边界框主要用于目标检测任务,其目的是识别图像中多个目标的位置和类型。 例如,如果 ...
    非极大值抑制 (NMS)

    非极大值抑制 (NMS)

    lijingle2022-1-3 14:12
    什么是非最大抑制,为什么要使用它?非最大抑制是一种主要用于目标检测的技术,旨在从一组重叠框中选择最佳边界框。 在下图中,非最大抑制的目的是去除黄色和蓝色框,这样我们就只剩下绿色框了。图 1:同一对象的多 ...
    论文解释:Masked Autoencoders Are Scalable Vision Learners

    论文解释:Masked Autoencoders Are Scalable Vision Learners

    lijingle2022-1-3 11:18
    重建图像的Mask部分如何有益自编码器在自然语言处理任务中有着成功的历史。 BERT 模型开始在句子的不同部分屏蔽单词,并尝试通过预测要填充到空格中的单词来重建完整的句子。 最近的工作旨在将这一想法转移到计算机 ...
电话咨询: 135xxxxxxx
关注微信