当前位置：首页 > news >正文

什么网站容易收录百度搜题

news 2025/7/7 5:27:34

什么网站容易收录,百度搜题,太原seo建站,有没有做试卷的网站视频合集链接矩阵补充（工业界不常用） 模型结构 embedding可以把用户ID 或者物品ID 映射成向量输入用户ID 和物品ID，输出向量的内积（一个实数），内积越大说明用户对这个物品越感兴趣模型中的两个embed…

视频合集链接

矩阵补充（工业界不常用）

模型结构

embedding可以把用户ID 或者物品ID 映射成向量
输入用户ID 和物品ID，输出向量的内积（一个实数），内积越大说明用户对这个物品越感兴趣
模型中的两个embedding层不共享参数

基本想法

用户 embedding 参数矩阵记作 $A$ 。第 $u$ 号用户对应矩阵第 $u$ 列，记作向量 $a_u$ 。
物品 embedding 参数矩阵记作 $B$ 。第 $i$ 号物品对应矩阵第 $i$ 列，记作向量 $b_i$ 。
內积 $a_u,b_i>$ 是第 $u$ 号用户对第 $i$ 号物品兴趣的预估值。
训练模型的目的是学习矩阵 $A$ 和 $B$ ，使得预估值拟合真实观测的兴趣分数。

在这里插入图片描述

数据集

(用户ID，物品ID，兴趣分数)的集合，记作 $Ω =\{(u, i,y)\}$
数据集中的兴趣分数是系统记录的，比如:
- 曝光但是没有点击，记为0分
- 点击、点赞、收藏、转发，各记1分
- 分数最低是0，最高是4

训练

有一个用户-物品交互矩阵，其中行代表用户，列代表物品，矩阵中的元素代表用户对物品的评分。由于用户通常只对少数物品进行评分，这个矩阵往往是稀疏的。因此需要补全这个矩阵

把用户ID、物品ID映射成向量。
- 第 $u$ 号用户 --> 向量 $a_u$
- 第 $i$ 号物品 --> 向量 $b_i$
训练时要求解优化问题，得到参数A和B
$min_{A,B} ∑_{(u, i, y)\in \Omega}( y-<a_u,b_i>)^2$
其中，A和B是embedding参数矩阵，不是用户-物品交互矩阵
解得A，B之后，根据A和B计算用户-物品交互矩阵中未曝光物品（灰色位置）的兴趣分数补全矩阵
向用户推荐补全的矩阵中分数较高的物品

在这里插入图片描述

缺点

在实践中效果不好…

缺点1:仅用 ID embedding，没利用物品、用户属性。

物品属性:类目、关键词、地理位置、作者信息。
用户属性:性别、年龄、地理定位、感兴趣的类目。
双塔模型可以看做矩阵补充的升级版

缺点2:负样本的选取方式不对。

样本:用户-物品的二元组，记作(u,i)。
正样本:曝光之后，有点击、交互。(正确的做法)
负样本:曝光之后，没有点击、交互。(错误的做法，这是一种想当然的做法，其实没有效果)

缺点3:做训练的方法不好。

內积〈au,bi〉不如余弦相似度。
用平方损失(回归)，不如用交叉熵损失(分类)

模型存储

训练得到矩阵A和B

A的每一列对应一个用户。
B的每一列对应一个物品。

把矩阵A的列存储到 key-value 表。

key是用户ID，value是A的一列。
给定用户ID，返回一个向量(用户的embedding)

矩阵B的存储和索引比较复杂

线上服务

把用户 ID作为 key，查询 key-value 表，得到该用户的向量，记作a°

最近邻查找:查找用户最有可能感兴趣的k个物品，作为召回结果。

第 $i$ 号物品的 embedding 向量记作 $b_i$
內积 $a,b_i>$ 是用户对第 $i$ 号物品兴趣的预估。
返回內积最大的k个物品。

缺点：如果枚举所有物品，时间复杂度正比于物品数量。

加速最近邻查找

支持最近邻查找的系统:Milvus、Faiss、HnswLib等等。
度
衡量最近邻的标准:

欧式距离最小(L2距离)
向量内积最大(内积相似度)
向量夹角余弦最大(cosine相似度，目前常用)

如何用cosine相似度计算最近邻

在进行线上服务之前对数据进行预处理，划分成很多区域

如何划分取决于用什么标准衡量最近邻
- 欧式距离最小：多边形
- cosine相似度：扇形

划分之后每个区域用一个向量表示

这些向量长度都是1（单位向量）
根据向量和点建立索引，把每个区域的向量作为key，区域中所有点的列表作为value，这样给定一个向量就可以取回那个区域所有的点

线上做召回时，把一个用户的向量a和所有索引向量对比，选出最相似的
通过索引找到物品列表，计算区域内每个物品与用户向量的相似度，选出最相似的k个点

这k个点就是最近邻查找的结果

在这里插入图片描述

http://www.ds6.com.cn/news/8462.html

相关文章：

b站推广网站2024年软文文章

wordpress投稿页面安卓神级系统优化工具

番禺做哪些做网站的网站竞价推广怎么做

外贸网站排名微信朋友圈广告30元 1000次

做汽车新闻哪个网站好游戏广告投放平台

wordpress用国外主题很卡seo关键词优化哪个平台好

网站后台管理系统源代码技能培训班有哪些课程

html展示网站源代码广州外包网络推广公司

手机端网站建站深圳网站营销seo电话

建立网站定制宁波seo快速排名

wordpress自定义文章链接seo技术网

如何将自己做的网站发布到网上网络推广员好做吗

网站建设开发今天的热搜榜

红桥网站建设公司百度seo公司整站优化

手机套东莞网站建设怎么自己开网站

长春市长春网站建设产品推广语

电商网站开源授权二次开发seo排名赚官网

万维网的网站如何做好网络推广销售

北京酒店企业网站建设代码优化

wordpress 企业站模板免费制作网页的网站

做网站如何引用头部网站设计制作教程

佛山网站如何制作搜狗推广平台

自己建的网站百度查找不到简述企业网站推广的一般策略

炫酷网站首页外贸推广

网站后台管理系统很慢福建百度推广

php做网站搜索框广点通投放平台登录

软慧网站建设最新国际足球世界排名

做网站赚钱不深圳全网营销型网站

网站建设要学什么如何让自己的网站排名靠前

个人备案的域名拿来做别的网站如何做网站优化