当前位置: 首页 > news >正文

济南网网络推广seo群发软件

济南网网络推广,seo群发软件,公司做的网站版权归谁所有,网络营销课程心得体会300字多类别分类的一个trick 探讨一下在多类别分类场景,如翻译、生成、目标检测等场景下,使用log_softmax的效果优于softmax的原因。 假设词典大小为10,一个词的ID为9(即词典的最后一个词),使用交叉熵作为损失函…

多类别分类的一个trick

探讨一下在多类别分类场景,如翻译、生成、目标检测等场景下,使用log_softmax的效果优于softmax的原因。
假设词典大小为10,一个词的ID为9(即词典的最后一个词),使用交叉熵作为损失函数,我们给出两组向量:

a = [0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1, 0.1]
b = [0.1, 0.1, 0.1, 0.1, 0.1, 0.05, 0.05, 0.1, 0.2, 0.1]

已知交叉熵损失函数定义如下:
l o s s = ∑ i = 0 k y i l o g ( p i ) loss = \sum^{k}_{i=0}y_ilog(p_i) loss=i=0kyilog(pi)
则根据公式,可分别计算得到:

CE(softmax(a), 9) = 2.3026
CE(log_softmax(a), 9) = 2.3026CE(softmax(b), 9)  = 2.3027
CE(log_softmax(b), 9) = 2.3033

则使用softmax操作的a,b向量在损失上相差-1e-4,而使用log_softmax在损失上相差-7e-4。
发现1:当类别概率预测错误时,CE(log_softmax(),)会加大错误类别惩罚。
这还不明显,我们现在假设

b = [0, 0, 0, 0, 0, 0.05, 0.05, 0, 0.1, 0.8]

CE(softmax(b), 9)  = 2.2084
CE(log_softmax(b), 9) =  1.6365

此时,对比一下softmax操作之后损失之差为9.42e-2,log_softmax损失之差为0.6661。
发现2:使用CE(softmax(),)即便预测概率分布很接近真实概率分布,在损失上下降也不是很明显(9.42e-2),但使用CE(log_softmax(),)会有非常显著的损失下降(0.6661,约为softmax的7倍)。

http://www.ds6.com.cn/news/87617.html

相关文章:

  • 汕头网站推广seo足球世界排名国家最新
  • php网站打开一片空白网络营销的主要传播渠道是
  • 房地产销售人员网站怎么做网站流量统计工具有哪些
  • 用java怎么做游戏下载网站吗中国市场营销网网站
  • 今天东莞封路宁宁网seo
  • 百度怎么制作网页seo自学教程seo免费教程
  • 安康那个公司做网站好百度建站云南服务中心
  • 深圳网站建设价格是多少做一个自己的网站
  • 好学校平台网站模板下载不了可以发广告的100个网站
  • 中国建设银行河北省分行官方网站seo网络优化是什么意思
  • 外国人在中国注册公司需要什么条件天津seo建站
  • 网站开发和设计seo技术培训
  • 网站建设发布ps科技感武汉百度
  • 小鱼儿企业网站管理系统网站推广投放
  • 做简历网站知乎在线seo优化工具
  • 随州网站建设多少钱百度指数的搜索指数
  • 网站建设南阳广州网络seo优化
  • 天津网站建设技术托管利尔化学股票股吧
  • 广西贵港建设集团有限公司网站seochinaz查询
  • 北京网站seo外包线上营销活动主要有哪些
  • 南宁做网站开发的公司有哪些苏州关键词优化怎样
  • 企业做网站价格网络营销论文毕业论文
  • 源码网站制作教程免费找客源软件
  • 项目计划书ai生成山东关键词优化联系电话
  • 网站在线客服模板seo品牌
  • 洪洞网站建设怎么制作个人网站
  • 免费源码分享提供seo顾问服务适合的对象是
  • 泰州市做网站化工网站关键词优化
  • 新闻网站开发方案百度手机app下载并安装
  • 30岁零基础学室内设计seo顾问是什么