当前位置: 首页 > news >正文

苏州专业网站设计百度平台商家

苏州专业网站设计,百度平台商家,wordpress 预订插件,专门做日租房的网站一、前言 本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!! 不得不说GAN真是博大精深! 二、大纲 GAN问世基本思想原理剖析Tips of GANGAN的应用Cycle GANEva…

一、前言

本文章作为学习2023年《李宏毅机器学习课程》的笔记,感谢台湾大学李宏毅教授的课程,respect!!!
不得不说GAN真是博大精深!

二、大纲

  • GAN问世
  • 基本思想
  • 原理剖析
  • Tips of GAN
  • GAN的应用
  • Cycle GAN
  • Evaluation of GAN

三、GAN问世

2014年Goodfellow 等人在《Generative Adversarial Networks》论文中首次提出了 GAN,随后各种各样的GAN百花齐放和发展,整个GAN的大家族网站:https://github.com/hindupuravinash/the-gan-zoo。

四、基本思想

GAN由两部分组成:Generator + Discriminator,简称为G和D。

  • Generator (生成器)
  • Discriminator(判别器)

精髓:G要想办法骗过D,D则是尽量挑出G假的内容,拟人化说法就是“对抗”。
举个例子:
G是屌丝,D是白富美,D心里择偶是有一杆称就是找个高富帅G’,下面就是屌丝伪装成高富帅的故事了:
第一次约会:G搞了个发型去见D,D说你衣品真差,黄了;
第二次约会:G买了套名牌西装去见D,D说你的车怎么是个共享自行车,黄了;
第三次约会:G租了一辆保驰捷911去见D,当然还搞了发型、穿了名牌西装,并说其实我一直都是高富帅,只不过家里在考验我的继承能力而已,并送出A货包包,D信了,于是两个人就在一起了。

从上面的例子看出,D每次都基于G的表现冒出一个标准,而G每次都按照D的标准重新纠正自己,反复进行下去,如果一方停下来,这场约会(“对抗”)也进行不下去了。

回归到图像生成这件事情上来:
具体步骤如下:

  • step1:固定G,得到输出的image(第一次都是噪点),输送给D,D根据看过的真实图片和G的假照片,训练出标准。D就像是分类器,要区分出来自G的data和real data。
    在这里插入图片描述
  • step2:有了标准D后,接着将其固定,反过来更新G,使得G输出的image送入D,D越难区分出来越好。
    在这里插入图片描述
    反复上述步骤1和2进行下去,以上就是GAN的基本思想和步骤,总体的流程图如下:
    在这里插入图片描述

五、原理剖析

  • Generator
    Generator分为两种:
    1、conditional (有额外条件的输入),有额外的x资讯。
    在这里插入图片描述

2、unconditional(没有额外条件的输入),没有额外的x作为输入。

在这里插入图片描述
Generator原理剖析:
1、先看G的左边:有个Normal Distribution,是个简单的正态分布(当然也可以是其他易表达的distribution),G从这个分布中抽取样本向量。
其实Normal Distribution可以理解为就是一个初始化的简单空间,还可以输入额外的条件x进行限制。
2、再看G的右边:右边就是转换后复杂的distribution,要和real data的分布越接近越好。

那如何计算两个分布的距离呢?
常见的列举以下两种:

  • JS divergence
  • KL divergence

当然还有很多方法,我们姑且称之为divergence。
因此,我们G的目标就是要找到一组参数,使得divergence最小。
于是乎,目标函数写作:
在这里插入图片描述
那Divergence如何计算呢,实做中很难算,比较复杂,这也是GAN遇到的难题。

这里先怀揣的着这个问题先,继续往下看下Discriminator。

  • Discriminator

Discriminator 判别器的工作原理很直觉,就是看到PG给低分,看到Pdata给高分,合起来的分数越高越好,这就是它的目标。
在这里插入图片描述
于是可以写作:
在这里插入图片描述
说明:V目标函数要最大化,其和两个参数有关,就是G和D。

V(D,G)长啥样呢?
在这里插入图片描述
这里直接给出公式,有兴趣的可查阅资料进行推导理解。

公式转换
巧了,发现JS divergence和max V(D,G)是相关的。
于是乎:
在这里插入图片描述
回答了Generator中Divergence怎么算的问题,就是统一换到V的表达方式,V的表达式又已经有了,就可以实做了。

小结:
至此,GAN的基本思想、操作过程、公式都说完了,比较难理解的应该就是公式部分,需要动手推一推。

六、Tips of GAN

JS divergence并非是合适的衡量指标,为啥呢?
因为,PG和Pdata的Distribution都是一个局部的分布,无法诠释真正的分布是长啥样,也有可能PG和Pdata重叠的部分只是冰山一角而已,而JS Divergence只要是不重叠得到的输出值就是log2,这并不合理。
在这里插入图片描述
从上图,显然两个分布已经是慢慢接近了,但只要不重叠就一直输出是log2。
所以,有人就提出了Wasserstein distance方法。

Wasserstein distance
Wasserstein distance 来自于WGAN,其精髓思想就是把P分布推到Q分布的距离算出来。
在这里插入图片描述
但是,推过去的方法有很多种,所以这里采用穷举并取最小的d作为Wasserstein Distance。
在这里插入图片描述
这样更好看出Distance的变化。
在这里插入图片描述

那如何计算Wasserstein Distance呢?这里直接给出公式:
在这里插入图片描述
足够平滑这件事情,实际上是定范围,让参数介于(-C,C)区间,超过就clip,还有一种Improve WGAN,提出Gradient Penalty,连接两个概率分布,算斜率,要接近于1。
在这里插入图片描述
比较好的方法是Spectrial Normal。

七、GAN的应用

Conditional Generation

  • 文生图
    输入:需要成对的文、图资料,还要有正样本和负样本效果才会比较好,正样本包括文、图匹配,负样本包括文不配、图清晰和文不配、图噪点情况。
    在这里插入图片描述

  • 图生图
    输入:同样需要成对的图、图。
    supervised + GAN 效果比较好,为什么呢?GAN富想象力,常生出意料外部分,supervised比较刻板,能把GAN拉回来。
    在这里插入图片描述

  • 音生图
    声音生成图像同样可以运作,x的条件输入换成声音即可。
    在这里插入图片描述

  • Talking Head Generation
    输入一张图片,生成gif图,这也是很牛的技术。
    在这里插入图片描述

八、Cycle GAN

GAN的变种,可用于图片风格的转换。
基本思想就是,当没有成对的训练资料时候,加上一个还原的过程,如下图将真实世界人脸转为卡通风格,并且期望通过另外一个G能够将卡通世界图片还原至真实世界人脸图,这样的做法目的是为了让卡通风格像输出真实世界人脸图。
D则是树立了卡通风格的标准。
在这里插入图片描述
同样,还可以应用在文字风格转换。

九、Evaluation of GAN

那如何评估GAN生成的图片的好坏呢?
一种办法是使用图片分类器进行评估,即输入一张图片,然后看这个图片分类器识别出多少个类别,如果类别越集中,那说明生成的图片的质量越好,如下图:

在这里插入图片描述
所以,整体上GAN生成的图片好不好,我们会从两方面进行衡量,即:

  • 1、高质量(越像越好);

  • 2、多样性
    那怎么评估多样性呢?
    就是看各个类别的和越平均,多样性越高。
    在这里插入图片描述
    实际过程可能会遇到:

  • Mode Collapse
    G产生的data老是集中在某一张,重复地出现,抓到D的盲点硬打一发。
    在这里插入图片描述

  • Mode dropping
    G产生的data多样性不够,老是集中在某一些,但是下次生成的也只是在此基础上稍加改变(比如颜色)
    在这里插入图片描述

http://www.ds6.com.cn/news/23241.html

相关文章:

  • 网页设计摘要网站推广与优化方案
  • 徐州网站建设哪家好北京网站优化专家
  • 做代练去什么网站安全吗凡科建站靠谱吗
  • 网站成立时间查询百度账号怎么改用户名
  • 做网站的公司宁波seo超级外链工具
  • 网站报价网上推广企业
  • 一二三级域名有什么区别郑州seo价格
  • 制作wordpress分享深圳网站seo
  • 晋城 网站建设济南做网站公司
  • 制作类网站建立自己的网站
  • 政府网站管理制度建设网络优化器免费
  • php动态网站开发 a卷软文营销的技巧
  • 科技部网站建设合同视频剪辑培训机构哪个好
  • WordPress表单支付插件seo中文
  • 连城县住房和城乡建设局 网站seo网站内容优化
  • 一个卖时时彩做号方法的网站青岛网站seo
  • wordpress的小程序seo数据是什么意思
  • 网站后台上传内容前台首页不显示必应搜索引擎地址
  • 商丘网约车seo是什么服务器
  • wordpress禁止搜索页面seo零基础培训
  • 营销型网站建设制作最近有新病毒出现吗
  • 东莞网站建设aj工作室网站优化排名资源
  • 新媒体管家seo专员很难吗
  • 专做奢侈品品牌的网站semen是什么意思
  • 专业网站制作友情链接平台赚钱吗
  • 如何做网站优化 纯外链做网站的软件有哪些
  • 浙江省建设继续教育网站首页google国外入口
  • 重庆做网站 外包公司有哪些免费网站做seo
  • 网站公司优势厦门seo服务
  • ui软件界面设计淘宝seo排名优化的方法