当前位置: 首页 > news >正文

帝国cms做企业网站中国今日新闻

帝国cms做企业网站,中国今日新闻,江苏优质网站制作公司,网站建设费属于什么税目一、目的 当Hive的计算引擎是spark或mr时,发现海豚调度HQL任务的脚本并不同,mr更简洁 二、Hive的计算引擎是Spark时 (一)海豚调度脚本 #! /bin/bash source /etc/profile nowdatedate --date0 days ago "%Y%m%d" y…

一、目的

当Hive的计算引擎是spark或mr时,发现海豚调度HQL任务的脚本并不同,mr更简洁

二、Hive的计算引擎是Spark时

(一)海豚调度脚本

#! /bin/bash
source /etc/profile

nowdate=`date --date='0 days ago' "+%Y%m%d"`
yesdate=`date -d yesterday +%Y-%m-%d`

hive -e "
use hurys_dc_dwd;

set hive.vectorized.execution.enabled=false;
set hive.auto.convert.join=false;
set mapreduce.map.memory.mb=10150;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.memory.mb=10150;
set mapreduce.reduce.java.opts=-Xmx8120m;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;
set hive.exec.parallel=true;
set hive.support.concurrency=false;
set mapreduce.map.memory.mb=4128;
set hive.vectorized.execution.enabled=false;

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=1000;
set hive.exec.max.dynamic.partitions=1500;

insert  overwrite  table dwd_evaluation partition(day='$yesdate')
select device_no,
       cycle,
       lane_num,
       create_time,
       lane_no,
       volume,
       queue_len_max,
       sample_num,
       stop_avg,
       delay_avg,
       stop_rate,
       travel_dist,
       travel_time_avg
from hurys_dc_ods.ods_evaluation
where volume is not null  and   date(create_time)= '$yesdate'
group by device_no, cycle, lane_num, create_time, lane_no,
         volume, queue_len_max, sample_num, stop_avg, delay_avg, stop_rate, travel_dist, travel_time_avg
"

(二)任务流执行结果

调度执行成功,时间需要1m29s

三、Hive的计算引擎是MR时

(一)海豚调度脚本

#! /bin/bash
source /etc/profile

nowdate=`date --date='0 days ago' "+%Y%m%d"`
yesdate=`date -d yesterday +%Y-%m-%d`

hive -e "
use hurys_dc_dwd;

set hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.max.dynamic.partitions.pernode=1000;
set hive.exec.max.dynamic.partitions=1500;

insert  overwrite  table dwd_evaluation partition(day='$yesdate')
select device_no,
       cycle,
       lane_num,
       create_time,
       lane_no,
       volume,
       queue_len_max,
       sample_num,
       stop_avg,
       delay_avg,
       stop_rate,
       travel_dist,
       travel_time_avg
from hurys_dc_ods.ods_evaluation
where volume is not null  and   date(create_time)= '$yesdate'
group by device_no, cycle, lane_num, create_time, lane_no,
         volume, queue_len_max, sample_num, stop_avg, delay_avg, stop_rate, travel_dist, travel_time_avg
"

(二)任务流执行结果

调度执行成功,时间需要1m3s

四、脚本区别

计算引擎为spark时,脚本比计算引擎为mr多,而且spark运行速度比mr慢

set hive.vectorized.execution.enabled=false;
set hive.auto.convert.join=false;
set mapreduce.map.memory.mb=10150;
set mapreduce.map.java.opts=-Xmx6144m;
set mapreduce.reduce.memory.mb=10150;
set mapreduce.reduce.java.opts=-Xmx8120m;
set hive.exec.dynamic.partition.mode=nonstrict;
set hive.exec.dynamic.partition=true;
set hive.exec.parallel=true;
set hive.support.concurrency=false;
set mapreduce.map.memory.mb=4128;
set hive.vectorized.execution.enabled=false;

mr为计算引擎时任务流脚本不能添加上面这些优化语句,不然会报错

在海豚调度HiveSQL任务流,推荐使用mr作为Hive的计算引擎。

不仅不需要安装spark,而且脚本简洁、任务执行速度快!

http://www.ds6.com.cn/news/59931.html

相关文章:

  • 广州视频网站建站公司seo顾问服务
  • 两学一做专题网站用途做网站流程
  • 拍卖网站功能需求文档百度网站大全首页
  • php网站开发有前景吗建立网站步骤
  • 广东省建设交易中心网站排名sem优化软件
  • 前端开发中英文网站怎么做seo关键词排名优化官网
  • b2c2b网站有哪些郑州建网站的公司
  • 太原免费静态网站制作上海企业网站seo
  • 做图必备素材网站企业产品营销策划推广
  • 做网站还有用吗免费刷seo
  • 做网站协调百度指数关键词搜索趋势
  • 哈尔滨最好的网站建设公司专业的郑州网站推广
  • H5响应式网站数据站长查询站长工具
  • 怎么用织梦制作响应式布局网站泰州seo排名扣费
  • 旅游网站建设方案书巩义网络推广外包
  • 机械加工网上接单平台有哪些啊河北seo诊断培训
  • 政府网站成为建设搜索引擎排名google
  • 深圳市网站建设公司设计贵阳关键词优化平台
  • 淄博手机网站营销推广的方法有哪些
  • 网站建设设计制作维护南宁百度seo
  • 企业网站管理系统破解版婚恋网站排名
  • 福田做网站福田网站建设福田建网站500专业做网站设计
  • 创新的网站建设公司排名seo搜索引擎优化推广专员
  • 哈尔滨定制网站建设网站推广的营销策划方案
  • 《水利建设与管理》杂志社网站太原百度seo排名软件
  • 网站导航栏三根横线怎么做的搜索引擎营销与seo优化
  • 制作平台网站方案seo网站优化课程
  • 网站流程图百度网络营销中心
  • 徐州网站建设培训营销型网站是什么意思
  • 网站建设一般要素百度灰色词优化排名