当前位置: 首页 > news >正文

上海服装品牌网站建设郑州中原区最新消息

上海服装品牌网站建设,郑州中原区最新消息,卖产品怎么做网站,b2b电商网站有哪些目录 一、第一种:parallelize 获取rdd时 二、第二种:通过外部读取数据-textFile 三、上面提到了默认分区数,那么默认分区是怎么计算呢? 一、第一种:parallelize 获取rdd时 没有指定:spark.default.paral…

目录

一、第一种:parallelize 获取rdd时

二、第二种:通过外部读取数据-textFile

三、上面提到了默认分区数,那么默认分区是怎么计算呢?


一、第一种:parallelize 获取rdd时

  • 没有指定:spark.default.parallelism参数值决定
  • 指定分区:指定几个,就是几个分区

总结:假如指定了分区数,分区数就是这个,假如没有指定spark.default.parallelism。

二、第二种:通过外部读取数据-textFile

  • 没有指定:spark.default.parallelism和2取最小值,

                         具体计算并行度的公式:min(spark.default.parallelism,2)

  • 指定分区:最小分区数,最少有这么多分区,具体的分区数可以根据HDFS分片规则来 hdfs                     ( 一片是128M或者128*1.1 = 140.8M)

rdd3 = sc.textFile("hdfs://bigdata01:9820/datas/wordcount/data.txt", minPartitions=2) 

假如你这个data.txt = 500M ,此时的分区数是:4  因为 500 =  128+ 128+ 128+ 116

三、上面提到了默认分区数,那么默认分区是怎么计算呢?

  • local模式

     默认并行度取决于本地机器的核数,即:

  1. local: 没有指定CPU核数,则所有计算都运行在一个线程当中,没有任何并行计算
  2. local[K]:指定使用K个Core来运行计算,比如local[2]就是运行2个Core来执行
  3. local[*]: 自动帮你按照CPU的核数来设置线程数。比如CPU有4核,Spark帮你自动设置4个线程计算
  • 集群模式

      集群模式包含Stanalone、Yarn模式,Mesos的默认并行度为8
      默认并行度取决于所有executor上的总核数与2的最大值,比如集群模式的设置如下:

--num-executors 5
--executor-cores 2
上面配置Executor的数量为5,每个Executor的CPU Core数量为2,
executor上的总核数10,则默认并行度为Max(10,2)=10。

http://www.ds6.com.cn/news/122124.html

相关文章:

  • 前端开发 网站建设北京百度快照推广公司
  • 网站降权不收录百度热度指数排行
  • 物联网管理平台厂家资源网站优化排名软件公司
  • 西安微信平台网站建设百度一下你就知道官方
  • 真人做爰视频网站北京百度seo排名点击器
  • 苏州专业网站seo推广外链怎么打开
  • 做新闻网站资质汕头seo不错
  • 旅游社做的最好的网站优化排名软件
  • 招聘网站怎么做海外独立站
  • 网站开发教育培训宁波网络推广平台
  • 武汉市城乡建设局网站凡科网站建站教程
  • 深圳福田住房和建设局网站官网国内军事新闻最新消息
  • wordpress后台载入慢深圳seo技术
  • c 做网站简单吗百度网页版
  • 购物网站推广方案百度怎么发布广告
  • 仿牌做独立网站可靠吗百度快速seo软件
  • 使用ecs做主机做淘客网站重庆森林粤语
  • 企业建设网站个人总结报告大作设计网站
  • 青州哪里做网站网站建设策划书范文
  • 怎么用电脑给域名做网站湖南网络推广公司大全
  • 二级域名可以单独做网站吗有什么公司要做推广的
  • h5制作网站开发推广宣传文案
  • 不属于网站架构seo职位具体做什么
  • 怎样优化网站案例免费网络推广100种方法
  • ps怎么排版规划设计网站免费建网站的平台
  • 怎么做电视台网站上海网络推广团队
  • 爱疯卷网站怎么做个人网站源码免费下载
  • 用asp做网站有哪控件网页制作教程书籍
  • 如何做书签网站百度一下百度知道
  • 做网站app要多钱发布外链的步骤