当前位置: 首页 > news >正文

大连比较好的建站公司企业网站制作要求

大连比较好的建站公司,企业网站制作要求,最近国语视频在线观看免费播放,做网站用的软件背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对: 1、向量维度及所需空间 向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至…

背景:现有亿级别数据(条数),其文本大小约为150G,label为字符串,content为文本。用于向量检索,采用上次的试验进行,但有如下问题需要面对:

1、向量维度及所需空间

向量维度一版采用768的bert系列的模型推理得到,openai也有类似的功能,不过是2倍的维度(即1536),至于哪个好坏,都宣称自己比较好,寡人实际应用中有实践:m3e-base似乎不错。

由于faiss需要float32的小数,根据下面试验,可以发现如果直接转成np.float32数据类型的数据然后直接进行存储(txt存储,每行进行存储),那么保留小数点后8位后存储的大小约为直接存储的数据的一半大小,同时节约了磁盘大小。在运行时,因为是大数据级别的,不建议将所有向量都求出来再进行存储,那样需要很大的内存,一般机器不支持,我这里的200G+的机器都over几次了。

存储试验:

res=np.random.randn(2,768)
with open("test768.txt","w") as f :for i in range(len(res)):tmp = res[i].astype(np.float32).tolist()# tmp = [round(i,8) for i in tmp]tmp
http://www.ds6.com.cn/news/108114.html

相关文章:

  • 免费做背景调查的网站足球最新世界排名表
  • php如何制作网站网络营销考试题目及答案2022
  • 学校网站建设招标方案做个小程序需要花多少钱
  • 厦门建站程序今日十大热点新闻事件
  • 建设监理有限责任公司网站搜索引擎查询
  • 短视频剪辑自学成都网站seo外包
  • 手机网站制作软件适合30岁女人的培训班
  • 网站建设与规划试卷海南seo代理加盟供应商
  • 网站设计与建设第一章无锡百度信息流
  • asp网站添加背景音乐廊坊百度关键词优化怎么做
  • 网站系统建设技术服务费新闻营销
  • 什么网站可以做免费广告公司seo是什么级别
  • 广州正规网站建设有哪些个人网站推广平台大全
  • 网站建设方案书范文怎么创建网站快捷方式
  • 网站群建设指导意见站长推广网
  • 怎么申请公司网址做seo推广一年大概的费用
  • c2c模式类型哈尔滨seo整站优化
  • wordpress评论自定义头像优化公司组织架构
  • 梅州网站建设公司网推和地推的区别
  • 随州建设局网站网站seo专员
  • 怎样用FW做网站的首页北京优化seo排名优化
  • 大兴安岭网站建设公司企业网站seo多少钱
  • 网站编程设计方向关键词搜索站长工具
  • 网站 只做程序百度拍照搜索
  • 品牌网站建设預定大蝌蚪网站推广是干嘛的
  • 价格划算的做网站如何注册属于自己的网站
  • 做网站从哪里找货源东莞关键词优化推广
  • 创意网站建设公司苏州网站开发公司
  • 做水产有什么网站冬镜seo
  • 怎么做网站自动响应windows优化大师有哪些功能