当前位置: 首页 > news >正文

网站开发公司排名前十舆情监控系统

网站开发公司排名前十,舆情监控系统,网站路径301重定向怎么做,做网站虚拟主机哪里有优点 首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocke…

优点

首先,bert的创新点在于利用了双向transformer,这就跟openai的gpt有区别,gpt是采用单向的transformer,而作者认为双向transformer更能够融合上下文的信息。这里双向和单向的区别在于,单向只跟当前位置之前的tocken相连,双向与当前位置之后的tocken也有连接。跟ELMo相比的优势在于,transformer对特征的提取能力比lstm要强得多。
在这里插入图片描述

模型输入

首先是对输入的句子做tocken embedding,也就是将句子映射为一维向量,可以是word2vec的结果,猜想一下,如果不是维度过高也可以是one-hot,第二部分segment embedding 是在模型训练过程中自动学习得到的,猜想这里可以用全连接,也可以用transformer,最后是position embedding,主要用以区别“我喜欢妈妈”和“妈妈喜欢我”,虽然这两句话的单词一样,但是因为位置不同,所以含义不同。
在这里插入图片描述

模型参数

BERTBASE (L=12, H=768, A=12, Total Parameters=110M)

BERTLARGE (L=24, H=1024,
A=16, Total Parameters=340M).

L表示层数,H为隐层维度,A为注意力头的数量

两种任务

Masked LM

这个任务主要是随机将某句话的某几个位置做处理,这里的处理可能是3种,80%的概率用[mask]代替,10%的概率保留原来的单词,10%的概率用其他单词代替。就像是英语考试中的完形填空
在这里插入图片描述

Next Sentence Prediction (NSP)

主要利用输入的第一个tocken[cls]和中间的tocken[sep],其中cls用来表示后面一句是否为前一句的下一句,sep表示两个句子的间隔。从文本语料库中随机选择 50% 正确语句对和 50% 错误语句对进行训练。就像是与语文中的句子排序。

参考:BERT模型的详细介绍

http://www.ds6.com.cn/news/28140.html

相关文章:

  • 京伦科技做的网站如何广告营销方式有哪几种
  • 公司网站优化要怎么做识图
  • wordpress制作小说网站模板下载sem推广竞价托管
  • 做数据可视化图的网站百度公司排名多少
  • 什么好的设计网站女教师遭网课入侵直播录屏曝
  • 做设计什么兼职网站建设建站公司排名
  • 如何搭建php网站十大接单推广平台
  • 云南建站推广seo案例分析100例
  • 中企动力全网门户网站今日国际新闻头条新闻
  • 武汉企业自助建站系统满十八岁可以申请abc认证吗
  • 北京网站优化对策河南省干部任免最新公示
  • 百度秒收录神器青岛seo优化公司
  • 推广甘肃省槐荫区网络营销seo
  • 网站建设的栏目规划如何免费推广自己的产品
  • 烟台商城网站制作网站seo软件
  • 做三方网站多少钱沈阳seo排名收费
  • 做外贸哪个网站比较好搜狗网站seo
  • 上海公司网站制作价格推广链接怎么制作
  • 宜兴做网站哪个好网站建设网络推广公司
  • 河北制作网站模板建站公司seo单页面优化
  • 一个人是否可以做公司网站seo管理系统
  • 做独立网站电商需要办营业执照吗网络推广引流
  • 百度竞价 百度流量 网站权重南京关键词网站排名
  • 长春疫情最新消息今天封城了2022网站seo在线优化
  • 天津做网站公司哪家好2022年近期重大新闻事件
  • 深圳网站设计制百度的网址是什么呢
  • 便宜的网站制作google网页版登录入口
  • 天津武清网站建设外链网址
  • wordpress 添加自定义栏目郑州seo排名公司
  • 大学生做兼职上什么网站好网络优化公司排名