当前位置: 首页 > news >正文

公司招聘网站续费申请企业品牌推广营销方案

公司招聘网站续费申请,企业品牌推广营销方案,c 网站开发架构,php给一个网站做后台前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的 于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每…

前一阵子查看我们公司的大数据平台的离线脚本运行情况, 结果发现有一个任务居然跑了一天多, 要知道这还只是几千万量级的表, 且这个任务是每天需要执行的

于是我把hive脚本捞出来看了下, 发现无非多join了几个复杂的子查询, 应该不至于这么久, 包括我又检查了是不是没有加上每日分区的筛选条件

在反反复复测试调整以后, 我发现问题出在这里:

隐式join的时候顺序问题会导致错误的笛卡尔积(不确定什么版本hive)
假如t1和t2关联,t2和t3关联, 但是如果写成了from t1,t3,t2比如下面这样, 就会造成t1和t3直接笛卡尔积, 再和t2笛卡尔积, 再where筛选

-- 
select x
from t1,t3,t2
where t1.id = t2.t1_id 
and t2.id = t3.t2_id

比如t1,t2,t3表都是1000, 彼此关联的是10条, 则按常理应该是t1和t2筛选和关联后得到临时表10条, 然后这10条再和t3进行10*1000筛选和关联.

但是根据explain解释执行, 貌似hive会将上面的直接1000* 1000*1000 可想而知这个效率会是怎么样
在这里插入图片描述

最后改为正确的顺序, 从1天多变成了二几分钟.搞定
在这里插入图片描述

结论

  1. hive这个不知道是不是bug, 也可能后续会修复, 但是保险起见最好按表的关联顺序来写
  2. 建议用显式join查询
  3. 写完hive脚本测试跑一次看看效率,不确定就explain
http://www.ds6.com.cn/news/119807.html

相关文章:

  • 垦利县企业型网站建设关键词搜索指数
  • 网站与网站链接怎么做湖南seo优化服务
  • 查询注册过的网站seo技术教程
  • dw做网站常用标签邀请注册推广赚钱的app
  • 网站建设合同黑客攻击网站seo专员招聘
  • 郑州百姓网交友征婚免费seo网站推广价格
  • dw做的网站如何让文字换行天天seo站长工具
  • dede程序数据库还原图文教程★适合dede网站迁移网络推广长沙网络推广
  • 景德镇网站制作餐饮营销手段13种手段
  • 成都倒闭的网站建设公司名单百度广告推广平台
  • 合肥网站建设司图免费推广网站地址大全
  • 做网站代码站长素材网站
  • 电商网站设计公司优选亿企邦恶意点击广告软件
  • 什么网站是做汽车装饰配件的安卓优化大师历史版本
  • 网站怎么做才能上百度首页宁波seo托管公司
  • wordpress数据爬虫seo建站公司推荐
  • 网站百度收录要多久营销型网站建设要点
  • 建设一个做资料库的网站网络推广外包哪家好
  • 群晖nas做网站域名域名信息查询
  • 杭州网站建设专家引擎seo优
  • 如何提高网站内容质量成都网站排名生客seo怎么样
  • 深圳网站设计公司哪个好棋牌软件制作开发多少钱
  • 有什么网站做生鲜配送的网络推广公司
  • 深圳做网站的网络公整站优化seo平台
  • 电商创客网站建设方案怎样做网站推广啊
  • 磁县专业做网站搜索引擎优化的对比
  • 企业登记网上注册百度关键词快速优化
  • 网站后台html编辑器外贸建站优化
  • 韶关市手机网站建设怎么样关键词查询工具
  • c 网站开发网站关键词快速排名软件