当前位置: 首页 > news >正文

网站外链建设方法搜索引擎推广法

网站外链建设方法,搜索引擎推广法,中国林业建设工程网站,青岛做网站的公司排名1.BERT-wwm 1-1 Whole Word Masking Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时&#xff…

1.BERT-wwm

1-1 Whole Word Masking

        Whole Word Masking (wwm)是谷歌在2019年5月31日发布的一项BERT的升级版本,主要更改了原预训练阶段的训练样本生成策略。 

        原有基于WordPiece的分词方式会把一个完整的词切分成若干个子词,在生成训练样本时,这些被分开的子词会随机被mask。 在Whole Word Masking (wwm)中,如果一个完整的词的部分WordPiece子词被mask,则同属该词的其他部分也会被mask。这缓解了在训练前 BERT 中屏蔽部分 Wordpiece 分词的缺点。

2.Chinese-BERT-wwm

2-1 中文BERT-WWM

        2019年哈工大和科大讯飞联合发表中文BERT-WWM模型的论文,使用中文文本对整个单词进行掩蔽,即屏蔽整个单词而不是屏蔽汉字。由于谷歌官方发布的BERT中,中文以字粒度进行切分,没有考虑到传统NLP中的中文分词。 Chinese-BERT-wwm将 Whole Word Mask的方法应用在了中文中,使用了中文维基百科(包括简体和繁体)进行训练,并且使用了哈工大LTP作为分词工具,即对组成同一个的汉字全部进行Mask。

2-2 样例

3.总结

        BERT-WWM对Bert的改进主要体现在mask的方式上,使用全词mask。

        其改进点如下:BERT-WWM不仅仅是连续mask实体词和短语,而是连续mask所有能组成中文词语的字。具体做法是,针对中文,如果一个完整的词的部分字被mask,则同属该词的其他部分也会被mask,即对组成同一个词的汉字全部进行Mask,即为全词Mask。

        这样做的目的是:预训练过程中,模型能够学习到词的语义信息,训练完成后字的embedding就具有了词的语义信息了,这对各类中文NLP任务都是友好的。

http://www.ds6.com.cn/news/118334.html

相关文章:

  • 哪家做网站公司好百seo排名优化
  • 石家庄商城网站建设绍兴百度seo
  • sqlite 做网站数据库湖北权威的百度推广
  • 网站的目标定位有哪些常见的营销手段
  • python做网站视频教程河南平价的seo整站优化定制
  • 学校网站建设的验收单贵阳网站建设推广
  • 敦煌网站外引流怎么做靠谱的代运营公司
  • 闵行网站建设公司纸百度推广全国代理商排名
  • 江宁外贸网站建设中国新闻网发稿
  • 织梦调用网站名称网络推广工作好做不
  • 江苏省工程建设招标网站百度指数明星搜索排名
  • 多用户商城网站建设厦门网站综合优化贵吗
  • 广东网络seo推广上海牛巨仁seo
  • 家居网站关键词怎么做什么是优化设计
  • 科技有限公司图片seow是什么意思
  • 杭州做产地证去哪个网站网络广告策划与制作
  • 买卖域名挣几十万搜索关键词排名优化技术
  • 南京做网站建设的公司网络营销百度百科
  • wordpress作者页面显示评论关键词优化公司电话
  • 做网站通常到哪找图片全自动推广引流软件
  • 网站建设平台网站设计手机百度极速版app下载安装
  • 做文化建设的网站有什么软件可以推广
  • 推广网站建设产品介绍南昌seo搜索优化
  • dw个人网站建立教学抖音关键词排名优化软件
  • 做安居客网站需要什么浏览器sem分析是什么
  • 鄂尔多斯做网站站长之家是什么网站
  • 什么职位做网站百度关键词优化策略
  • 做实验学编程的网站网络营销模式包括哪些
  • 网站打不开显示asp百度app官方下载安装到手机
  • 网站建设商城 买模板外链代发平台