当前位置: 首页 > news >正文

网站自助授权系统电脑培训班价目表

网站自助授权系统,电脑培训班价目表,浙江省建设培训中心网站首页,html5网页制作课程一.论文 1.1 P-tuning 区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中 上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入pro…

一.论文

1.1 P-tuning

区别于之前的工作,这篇工作认为promote可以在句子中的任意位置起到作用,可以将它们插入上下文或目标中

上图中,左图是不使用任何操作,右图是选择在居首和目标前插入promote的embedding,插入promote的过程可以表示为

其中x代表一系列离散的输入令牌,y代表目标(可以理解为希望模型想要给你的回答),e()表示对应的embedding,其实就是将其参数化映射成为伪tokens,即

通过最小化这些参数

1.2 promote生成

嵌入的promote实际上可以理解为不一定离散不相互关联的,而实际上的promote其实应该是高度离散的且具有关联性的,因此作者选择使用双向长短期记忆网络(LSTM),激活函数和MLP来建模这种关系

在推理中,我们只需要输出嵌入h,并且可以丢弃LSTM头

二.代码

本质上是使用一个PromptEncoder来生成伪的embedding添加到原先的embedding中

2.1 训练

训练过程只更新promote_encoder中的参数

 2.1.1 PromptEncoder

在PTuneForLAMA中实例化了PromptEncoder

 PromptEncoder本质上是一个(嵌入 + LSTM + MLP)

import torch
import torch.nn as nnclass PromptEncoder(torch.nn.Module):def __init__(self, template, hidden_size, tokenizer, device, args):super().__init__()self.device = deviceself.spell_length = sum(template)self.hidden_size = hidden_sizeself.tokenizer = tokenizerself.args = args# ent embeddingself.cloze_length = templateself.cloze_mask = [[1] * self.cloze_length[0]  # first cloze+ [1] * self.cloze_length[1]  # second cloze+ [1] * self.cloze_length[2]  # third cloze]self.cloze_mask = torch.LongTensor(self.cloze_mask).bool().to(self.device)self.seq_indices = torch.LongTensor(list(range(len(self.cloze_mask[0])))).to(self.device)# embeddingself.embedding = torch.nn.Embedding(len(self.cloze_mask[0]), self.hidden_size).to(self.device)# LSTMself.lstm_head = torch.nn.LSTM(input_size=self.hidden_size,hidden_size=self.hidden_size // 2,num_layers=2,dropout=self.args.lstm_dropout,bidirectional=True,batch_first=True)self.mlp_head = nn.Sequential(nn.Linear(self.hidden_size, self.hidden_size),nn.ReLU(),nn.Linear(self.hidden_size, self.hidden_size))print("init prompt encoder...")def forward(self):input_embeds = self.embedding(self.seq_indices).unsqueeze(0)output_embeds = self.mlp_head(self.lstm_head(input_embeds)[0]).squeeze()return output_embeds

2.1.2 调用

在PTuneForLAMA的forward函数中调用了embed_input来实现

http://www.ds6.com.cn/news/12893.html

相关文章:

  • 京东pc网站用什么做的网站推广排名公司
  • 电商哪个岗位最吃香天津债务优化公司
  • 合肥seo网站推广阿里大数据官网
  • 做网站 橙色怎么搭配在百度怎么免费发布广告
  • 互联网技术的发展西安网站优化公司
  • 沈阳网站建站外贸怎么找客户资源
  • 笑话网站模板网络营销考试题目及答案2022
  • 商城微网站创建怎么在百度发布自己的文章
  • 手机网站 数据库社群推广平台
  • 网页设计公司未来三年规划网站排名优化怎么做
  • 景德镇网站建设公司淘宝运营一般要学多久
  • 网站源码 手机 微信鸣蝉智能建站
  • 帮人做任务的网站爱站官网
  • 企业做网站有用么推广营销
  • 白底图片在线制作百度竞价seo排名
  • 织梦网站后台管理系统百度统计网站
  • 南京网站设计公司哪儿济南兴田德润怎么联系百度关键字优化价格
  • 廊坊cms建站模板网站seo技术教程
  • 昆明企业公司网站建设如何建立网上销售平台
  • 做网站 多少钱一般的电脑培训班要多少钱
  • 网站建设工期手机百度浏览器
  • 哪家可以做网站建网站用什么工具
  • 做英文网站费用多少太原免费网站建站模板
  • dreamweaver如何下载网站优化是做什么的
  • 政府网站建设历史国家免费技能培训
  • 如今做哪些网站致富百度推广官方网站
  • 慈利网站建设哈尔滨seo优化软件
  • 如何做网站百度排名优化找培训机构的网站
  • 宁夏建设工程招标投标信息网站链接是什么意思
  • php做网站项目的流程促销策略的四种方式