当前位置: 首页 > news >正文

池州网站建设怎么样3d建模培训班一般多少钱

池州网站建设怎么样,3d建模培训班一般多少钱,专业建设网站开发,博彩外围网站怎么做spark的代码分为两种 本地代码在driver端直接解析执行没有后续 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算 spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G sc.textFile("/home/ha…

spark的代码分为两种

  • 本地代码在driver端直接解析执行没有后续

  • 集群代码,会在driver端进行解析,然后让多个机器进行集群形式的执行计算

spark-shell --master spark://nn1:7077 --executor-cores 2 --executor-memory 2G
sc.textFile("/home/hadoop/a.txt")
org.apache.spark.rdd.RDD[String] = /home/hadoop/a.txt MapPartitionsRDD[1] at textFile at

rdd弹性分布式数据集合

  • 如果是sc调用的方法会在集群中执行
  • rdd调用的方法也会集群执行
sc.textFile("/home/hadoop/a.txt")

不是单机代码,但是文件不能再某一个机器上,因为这个命令所有的机器都会执行。

这个路径一定要放在hdfs中

问题:第一行代码就读取了数据,为什么第一行没有出现错误?

spark中的方法[算子]它是分为两种

  • 转换类算子,定义逻辑,并且调用完毕以后具有返回值的,调用算子以后是不是返回rdd
  • 行动类算子,触发计算,并且没有rdd的返回

代码的整体逻辑是先使用转换类算子定义逻辑,但是不执行,一旦使用action算子就会触发运算,整体才执行,这样的设计能够最大化的减少内存的使用。

所以上传hdfs文件,读取

hdfs dfs -put /home/hadoop/a.txt /

spark-shell整体代码

scala> //在spark-env.sh中配置HADOOP_CONF_DIR,默认会读取hdfs中的文件scala> sc.textFile("/a.txt")
res6: org.apache.spark.rdd.RDD[String] = /a.txt MapPartitionsRDD[5] at textFile at <console>:26
//放入数据到hdfs中
scala> res6.flatMap(_.split(" "))
res7: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[6] at flatMap at <console>:27scala> res7.map((_,1))
res8: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[7] at map at <console>:27scala> res8.groupBy(_._1)
res9: org.apache.spark.rdd.RDD[(String, Iterable[(String, Int)])] = ShuffledRDD[9] at groupBy at <console>:27
//分组完毕的返回值不再是map而是RDD[String,Iterable]
scala> res9.mapValues(_.size)
res10: org.apache.spark.rdd.RDD[(String, Int)] = MapPartitionsRDD[10] at mapValues at <console>:27
//mapValues在scala中只能作用在map集合上,现在可以作用在RDD[k,v]
scala> res10.foreach(println)
//打印数据的时候每个机器都有,因为是分布式执行的

http://www.ds6.com.cn/news/91727.html

相关文章:

  • 北京国互网网站建设价格软文是什么样子的
  • 建设工程检测报告查询网站公司品牌推广方案范文
  • 网站设计培训课程如何自己建立一个网站
  • 郑州有做彩票网站的吗江苏搜索引擎优化
  • 网站关键词推广方案安装百度到桌面
  • 一级a做爰片凤凰网站解释seo网站推广
  • 网站备案 法人身份证今日国内新闻10则
  • 合肥大型网站制怎么在百度上做广告
  • 云服务器ecs做网站sem公司
  • 美的公司网站建设的目的青岛网站关键词优化公司
  • 做视频用的网站有哪些正规的培训学校
  • 怎么做一个动态网站吗seo北京网站推广
  • 萍乡网站建设公司信息流广告投放渠道
  • 赣州网站设计哪里好电商网站建设
  • 一个做网站的公司年收入真正永久免费的建站系统有哪些
  • 沈阳网约车公司重庆百度整站优化
  • wordpress 页面固定外贸网站seo
  • 合肥最好的网站建设公司排名网络推广深圳有效渠道
  • 贵阳有哪家做网站建设好点的广告推广平台网站
  • 网站建设起到计划和指导作用营销管理系统
  • 厦门市城乡建设局网站河北网站推广
  • 静安西安网站建设青岛网站建设方案优化
  • 网站开发的软件环境有哪些百度推广客服
  • 余姚做网站62752762目前好的推广平台
  • 营销网站建设培训知名的建站公司
  • 优化师是做什么的seo优化的优点
  • 北京做网站公司的排名搜索图片
  • b站做简介的网站鞋子软文推广300字
  • 北京建站模板企业seo网站优化公司
  • 电子商务网站设计分析怎么做免费的电脑优化软件