当前位置: 首页 > news >正文

西宁网站开发抖音营销推广怎么做

西宁网站开发,抖音营销推广怎么做,最好看的网站设计,付费网站怎么做&&大数据学习&& 🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一下博主哦&#x1f91…

&&大数据学习&&

🔥系列专栏: 👑哲学语录: 承认自己的无知,乃是开启智慧的大门
💖如果觉得博主的文章还不错的话,请点赞👍+收藏⭐️+留言📝支持一下博主哦🤞


Spark Shuffle

Map 和 Reduce
在Shuffle过程中. 提供数据的称之为Map端(Shuffle Write) 接收数据的 称之为 Reduce端(Shuffle Read)
在Spark的两个阶段中, 总是前一个阶段产生 一批Map提供数据, 下一阶段产生一批Reduce接收数据。
1248719256074146a794a8fb373afe78.png
Spark 提供2种Shuffle管理器:
• HashShuffleManager
• SortShuffleManager
524b57ea17f14634b70cc38f057f5797.png
优化后
基本和未优化的一致,不同点在于
1. 在一个Executor内, 不同Task是共享Buffer缓冲区
2. 这样减少了缓冲区乃至写入磁盘文件的数量, 提高性能

SortShuffleManager

SortShuffleManager的运行机制主要分成两种,一种是普通运行机制,另一种是bypass运行机制。
bypass运行机制的触发条件如下:
1)shuffle map task 数量小于
spark.shuffle.sort.bypassMergeThre
shold=200 参数的值。
2) 不是聚合类的 shuffle 算子 ( 比如
reduceByKey)
同普通机制基本类同 , 区别在于 , 写入磁盘临时文件的时候不会在内 存中进行排序 而是直接写 , 最终合并为一个 task 一个最终文件
所以和普通模式 IDE 区别在于 :
第一,磁盘写机制不同;
第二,不会进行排序。也就是说,启用该机制的最大好处在于, shuffle write 过程中,不需要进行数据的排序操作,也就节省掉了 这部分的性能开销。
26da361319174e99bfef24501ebf55fd.png
1. SortShuffle对比HashShuffle可以减少很多的磁盘 文件,以节省网络IO的开销
2. SortShuffle主要是对磁盘文件进行合并来进行文件 数量的减少, 同时两类Shuffle都需要经过内存缓冲区 溢写磁盘的场景。所以可以得知, 尽管Spark是内存迭 代计算框架, 但是内存迭代主要在窄依赖中. 在宽依赖(Shuffle)中磁盘交互还是一个无可避免的情况. 所 以, 我们要尽量减少Shuffle的出现, 不要进行无意义的Shuffle计算。

 

http://www.ds6.com.cn/news/68495.html

相关文章:

  • wordpress 不提示更新如何seo推广
  • 深圳精品网站建设公司seo霸屏软件
  • 外贸企业邮箱哪家好网络优化的内容包括哪些
  • 微信小程序开发制作平台成都网站seo推广
  • 张家港网站建设做网站2021年经典营销案例
  • 小米企业网站的优化建议搜索引擎技术包括哪些
  • 商务网站建设考试题库如何做网站推广
  • 银川seo优化抖音seo优化系统招商
  • 网站大图怎么做更吸引客户关联词有哪些关系
  • 2_试列出网站开发建设的步骤万网域名管理平台
  • 织梦做的网站用什么数据库志鸿优化网官网
  • 临沂免费自助建站模板图片外链
  • 秦皇岛做网站多少钱上海网络推广外包
  • 菏泽做网站公司推广一次多少钱
  • 网站后台演示网络营销策划方案书范文
  • 事件网站推广长沙网站推广 下拉通推广
  • 英雄联盟怎么做直播网站网站制作公司排行榜
  • 网站怎么做内部链接软文范例100例
  • 深圳网站建设知了网络西安seo排名收费
  • 公司网站后如何更新济南seo顾问
  • 电商视觉设计win10优化大师是官方的吗
  • 吉林科技网站建设网站设计软件
  • 广东省经营性网站备案网站策划书案例
  • 手机建网站制作韩国比分预测
  • 做网站维护学什么编程语言上海推广服务
  • 用手机做自己的网站淘宝大数据查询平台
  • 网站建设代理政策关键词优化是怎样收费的
  • 北京东宏建设网站网络营销推广方案策划书
  • 网站建设 事业单位 安全网站搜索系统
  • 沈阳大十字街附近做网站公司企业网站制作价格