当前位置: 首页 > news >正文

手机网站建设设计网络营销产品概念

手机网站建设设计,网络营销产品概念,做360手机网站首页,二手交易平台 网站开发论文下载:https://openreview.net/pdf?idr1xMH1BtvB 另一篇分析文章:ELECTRA 详解 - 知乎 一、概述 对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。 不是对选择的token直接用mask替代,而是替换为…

论文下载:https://openreview.net/pdf?id=r1xMH1BtvB

另一篇分析文章:ELECTRA 详解 - 知乎

一、概述

对BERT的token mask 做了改进。结合了GAN生成对抗模型的思路,但是和GAN不同。

不是对选择的token直接用mask替代,而是替换为一个生成器网络产生的token。

然后训练模型时并不是只被破坏的token,而是训练一个辨别模型来预测这些被破坏的输入的每一个token是否是被生成模型生成的样本替代的。因为将GANs应用于文本很困难,所以生成损坏token的生成器是以最大似然进行训练的。

小generator和大discriminator共同训练,但判别器的梯度不会传给生成器

fine-tuning 时丢弃generator,只使用discriminator

二、网络结构和训练

1、模型训练两个网络G和D。

        G:给定位置t,将该位置token替换为mask,输入到G,G输出一个概率,结合softmax层,来产生mask位置的xt,从而G产生损坏的输入。输出只在mask的token中计算分数,不是所有的token。

        D:给定位置t,D预测xt是否是真的。输出只在mask的token中预测是不是真的,不是所有的。

        对于给定一个随机位置序列,原始输入对应位置替换为[MASK] token,输入G,G学习恢复原始序列。D来分辨哪些token是被生成器产生的样本替换的。

文本损坏过程描述为:

2、损失函数为:

MLM损失的计算只计算m个,即m个被masked tokens

Disc损失 t的取值到 1..n,每个token都会更新参数

        在训练过程中,discriminator的loss不会反向传播到generator(因为generator的sampling的步骤导致),在pre-training之后,只使用discriminator进行fine-tuning.

http://www.ds6.com.cn/news/48034.html

相关文章:

  • 福建省网站建设方案书最新网站推广方法
  • 我的世界做弊端网站网络营销的优势有哪些?
  • 宣传旅游网站建设的重点是什么百度seo排名360
  • 母婴类网站怎么建设全网搜索
  • 阿里云有了域名 网站建设百度提问登陆入口
  • 湖州市城乡建设局网站引流获客工具
  • 哔哩哔哩网站开发图片营销渠道有哪几种
  • 百度怎么做公司的网站优就业seo课程学多久
  • 网站建设确认单seo研究中心南宁线下
  • 一流本科专业建设点网站百度广告投放平台
  • 在线定制家具青岛谷歌优化
  • 肥乡网站建设企业如何网络推广
  • 南昌seo计费管理手机系统优化软件
  • 广州网站建设找哪里网站统计分析平台
  • 天河移动网站建设百度推广代理商
  • 二级网站收录seo的优化技巧和方法
  • 网站模板框架微信小程序开发教程
  • 江苏宏远建设集团网站网络推广主要是做什么工作
  • wordpress tag中文常用的seo工具
  • 做海报的网站有哪些网络营销计划书怎么写
  • 网站建设实习怎么做网页宣传
  • 杭州做网站的优质公司海外新闻发布
  • wordpress s7seo顾问服务 品达优化
  • 江苏建设网站公司app推广引流方法
  • 苏州论坛型网站建设阿里seo排名优化软件
  • 公司微网站怎么建设网址大全浏览器app
  • 上海市工程建设协会网站seo网站诊断
  • wordpress左图右字夫唯seo
  • wordpress怎么采集常州网站优化
  • wordpress可以做电影网站吗个人网站免费制作平台