当前位置: 首页 > news >正文

漳州微信网站建设电话百度端口开户推广

漳州微信网站建设电话,百度端口开户推广,有什么网站是做企业型的,wordpress get tags&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


对于一个分布式的计算任务而言,设置一个合适的并行度十分重要。Hive的计算任务由MapReduce完成,故并行度的调整需要分为Map端和Reduce端。

12.7.1.1 Map端并行度

Map端的并行度,也就是Map的个数。是由输入文件的切片数决定的。一般情况下,Map端的并行度无需手动调整。

以下特殊情况可考虑调整map端并行度:

1)查询的表中存在大量小文件

按照Hadoop默认的切片策略,一个小文件会单独启动一个map task负责计算。若查询的表中存在大量小文件,则会启动大量map task,造成计算资源的浪费。这种情况下,可以使用Hive提供的CombineHiveInputFormat,多个小文件合并为一个切片,从而控制map task个数。相关参数如下:

set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

2)map端有复杂的查询逻辑

若SQL语句中有正则替换、json解析等复杂耗时的查询逻辑时,map端的计算会相对慢一些。若想加快计算速度,在计算资源充足的情况下,可考虑增大map端的并行度,令map task多一些,每个map task计算的数据少一些。相关参数如下:

--一个切片的最大值set mapreduce.input.fileinputformat.split.maxsize=256000000;

12.7.1.2 Reduce端并行度

Reduce端的并行度,也就是Reduce个数。相对来说,更需要关注。Reduce端的并行度,可由用户自己指定,也可由Hive自行根据该MR Job输入的文件大小进行估算。

Reduce端的并行度的相关参数如下:

--指定Reduce端并行度,默认值为-1,表示用户未指定set mapreduce.job.reduces;--Reduce端并行度最大值set hive.exec.reducers.max;--单个Reduce Task计算的数据量,用于估算Reduce并行度set hive.exec.reducers.bytes.per.reducer;

Reduce端并行度的确定逻辑如下:

若指定参数mapreduce.job.reduces的值为一个非负整数,则Reduce并行度为指定值。否则,Hive自行估算Reduce并行度,估算逻辑如下:

假设Job输入的文件大小为totalInputBytes

参数hive.exec.reducers.bytes.per.reducer的值为bytesPerReducer。

参数hive.exec.reducers.max的值为maxReducers。

则Reduce端的并行度为:

根据上述描述,可以看出,Hive自行估算Reduce并行度时,是以整个MR Job输入的文件大小作为依据的。因此,在某些情况下其估计的并行度很可能并不准确,此时就需要用户根据实际情况来指定Reduce并行度了。

http://www.ds6.com.cn/news/62946.html

相关文章:

  • 重庆光龙网站建设网站服务器查询工具
  • 网站建设gzzhixun济宁网站建设
  • 一站式网站开发天门seo
  • 长沙网站建设找哪家广告免费发布信息
  • 学编程的好处网站seo关键词
  • 个人网站建设的小清新图片网络营销推广的渠道有哪些
  • 东莞品牌网站定制关键词点击排名软件
  • 做视频周边的网站百度网页版进入
  • 公司手机网站如何自己开网站
  • 全国国家公示系统官网北京seo公司排名
  • 济南网络推广外包公司seo优化师
  • cnzz网站建设教学seo排名关键词
  • 网上商城网站设计和实现商铺营销推广方案
  • 深圳网站开发ucreator怎么做seo信息优化
  • 企业建站域名天津seo网络
  • 佛山网站排名优化手机百度ai入口
  • 给网站底部做友情链接爱链网买链接
  • 有哪些做软件的网站关键词优化公司电话
  • 慧聪网网站建设策略google搜索入口
  • 淮南做网站的海南网站设计
  • 网站建设方案解救苏州久远网络网址导航怎样推广
  • 网站开发 国际网站外贸网站推广平台
  • 做深度游网站 知乎全球网站流量排名查询
  • 深圳住房建设保障局常德seo
  • 腾讯企业邮箱域名可以做网站吗2022知名品牌营销案例100例
  • 建设项目经济评价网站百度刷seo关键词排名
  • 深圳网站建设素材网站今日头条新闻头条
  • 网站外包谁报价电商营销推广方法
  • 做网站要不要花钱做店长百度云网盘下载
  • 做58同城网站需要多少钱郑州网站推广优化公司