当前位置: 首页 > news >正文

丹阳网站设计郑州百度公司地址

丹阳网站设计,郑州百度公司地址,武汉做网站最好的公司,网站备案 域名备案残差连接和层规范化 层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。 以下代…

残差连接和层规范化

层规范化和批量规范化的目标相同,但层规范化是基于特征维度进行规范化。尽管批量规范化在计算机视觉中被广泛应用,但在自然语言处理任务中(输入通常是变长序列)批量规范化通常不如层规范化的效果好。

以下代码对比不同维度的层规范化和批量规范化的效果。

ln = nn.LayerNorm(2)
bn = nn.BatchNorm1d(2)
X = torch.tensor([[1, 2], [2, 3]], dtype=torch.float32)
# 在训练模式下计算X的均值和方差
print('layer norm:', ln(X), '\nbatch norm:', bn(X))
layer norm: tensor([[-1.0000,  1.0000],[-1.0000,  1.0000]], grad_fn=<NativeLayerNormBackward0>)
batch norm: tensor([[-1.0000, -1.0000],[ 1.0000,  1.0000]], grad_fn=<NativeBatchNormBackward0>)

现在可以使用残差连接和层规范化来实现AddNorm类。暂退法也被作为正则化方法使用。

#@save
class AddNorm(nn.Module):"""残差连接后进行层规范化"""def __init__(self, normalized_shape, dropout, **kwargs):super(AddNorm, self).__init__(**kwargs)self.dropout = nn.Dropout(dropout)self.ln = nn.LayerNorm(normalized_shape)def forward(self, X, Y):return self.ln(self.dropout(Y) + X)

残差连接要求两个输入的形状相同,以便加法操作后输出张量的形状相同。 

add_norm = AddNorm([3, 4], 0.5)
add_norm.eval()
add_norm(torch.ones((2, 3, 4)), torch.ones((2, 3, 4))).shape

 torch.Size([2, 3, 4])

 

 

 

http://www.ds6.com.cn/news/43384.html

相关文章:

  • 网站点击量在哪里看网络营销培训课程
  • 广西建设厅网站招 标 信 息优化设计官方电子版
  • 删格化网站设计视频推广渠道有哪些
  • 网站代码跑偏了怎么做免费友情链接交换平台
  • 南京企业网站seo南宁网站推广排名
  • wordpress开玩笑_呵?百度关键词优化工具
  • 做网站怎么拿框架的原代码平台app开发制作
  • 网站搭建与网站建设网站新站整站排名
  • qq是哪个国家公司开发的软件seo在线网站推广
  • 域名空间都有了怎么做网站百度推广账号登陆入口
  • 做网站公司需要什么谷歌seo快速排名软件首页
  • 自己做行程的网站指数基金定投技巧
  • 有谁可以做网站寄生虫三一crm手机客户端下载
  • wordpress页面响应慢前后端手机seo关键词优化
  • 静态网站优化seo排名软件哪个好用
  • 汕头企业建站系统模板百度seo推广优化
  • 生猪价格今日猪价最新走势图十堰seo
  • 阿里巴巴网站建设方案书网络推广和网络营销的区别
  • 如何做网站热线电话市场推广渠道有哪些
  • 泸州软件开发公司厦门seo培训学校
  • html5 公众号 网站开发南宁百度seo软件
  • 文化传媒公司网站建设2022年新闻大事
  • 石家庄 网站建设 15369356722国内新闻最新
  • 一个域名怎么做多个网站百度灰色关键词代发
  • h5做网站什么软件成都企业seo
  • 专做蔬菜水果的网站核酸检测最新消息
  • 备案关闭网站建设影响网络推广有哪些常见的推广方法
  • 教育类集群网站建设搜索引擎的设计与实现
  • dw做动态网站发布外链
  • 自己编程做网站中国疫情最新数据