当前位置: 首页 > news >正文

白山市住房和城乡建设局网站nba最新排行榜

白山市住房和城乡建设局网站,nba最新排行榜,淮安网站设计,网络最有效的推广方法1.BERT-wwm 1-1 Whole Word Masking Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时&#xff…

1.BERT-wwm

1-1 Whole Word Masking

        Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 

        原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时,这些被分开的子词会随机被mask。 在Whole Word Masking (wwm)中,如果一个完整的词的部分WordPiece子词被mask,则同属该词的其他部分也会被mask。这缓解了在训练前 BERT 中屏蔽部分 Wordpiece 分词的缺点。

2.Chinese-BERT-wwm

2-1 中文BERT-WWM

        2019年哈工大和科大讯飞联合发表中文BERT-WWM模型的论文,使用中文文本对整个单词进行掩蔽,即屏蔽整个单词而不是屏蔽汉字。由于谷歌官方发布的BERT中,中文以字粒度进行切分,没有考虑到传统NLP中的中文分词。 Chinese-BERT-wwm将 Whole Word Mask的方法应用在了中文中,使用了中文维基百科(包括简体和繁体)进行训练,并且使用了哈工大LTP作为分词工具,即对组成同一个的汉字全部进行Mask。

2-2 样例

3.总结

        BERT-WWM对Bert的改进主要体现在mask的方式上,使用全词mask。

        其改进点如下:BERT-WWM不仅仅是连续mask实体词和短语,而是连续mask所有能组成中文词语的字。具体做法是,针对中文,如果一个完整的词的部分字被mask,则同属该词的其他部分也会被mask,即对组成同一个词的汉字全部进行Mask,即为全词Mask。

        这样做的目的是:预训练过程中,模型能够学习到词的语义信息,训练完成后字的embedding就具有了词的语义信息了,这对各类中文NLP任务都是友好的。

http://www.ds6.com.cn/news/68813.html

相关文章:

  • 东莞网站建设公司服务平台seo网络营销是什么意思
  • 温岭市建设工程质量安全网站网上怎么注册公司免费的
  • 兰州网站站长工具网站备案查询
  • z blog网站怎么做描述线上营销活动方案
  • 网站做管理员消息推送域名地址查询
  • 葡萄酒+东莞网站建设网络服务主要包括什么
  • 做珠宝网站公司企业网站制作哪家好
  • 学校网站建设平台如何制作百度网页
  • 公司网站如何建设教学视频如何推广微信公众号
  • 西安做一个企业网站要多少钱网店怎么运营和推广
  • 廊坊哪里有做网站建设的青岛网站建设有限公司
  • 网站建设客户常问到的问题天津关键词排名推广
  • 网站建设费开票税收代码seo的定义是什么
  • 做网站要求什么条件sem 优化价格
  • wap网站开发价钱网站推广优化是什么意思
  • 网站建设经典范例淘宝店铺怎么引流推广
  • 什么网站教你做美食百度推广后台登陆入口
  • 哪个网站可以做行程攻略沈阳seo排名优化软件
  • 做网站优化给业务员提成以图搜图百度识图网页版
  • 影视在YouTube网站上做收益难吗收录网
  • wordpress阿里云域名转移seo工具
  • 青海建筑网站建设公司网络营销百科
  • 网站后台看不到部分内容巨量算数数据分析入口
  • 做研究的网站网站建设制作过程
  • web可以做3d网站吗外包客服平台
  • 马可波罗网站做外贸采集站seo提高收录
  • 微名片网站怎么做今日小说百度搜索风云榜
  • 树莓派做影视网站浏览器网站大全
  • 保险做的好的网站有哪些沪深300指数基金
  • 城乡与建设部网站首页线上营销平台