当前位置: 首页 > news >正文

做网站报价单海外网站推广的公司

做网站报价单,海外网站推广的公司,学做淘宝店的网站,龙江手机网站建设文章目录 一、Lambda架构1、Lambda的三层架构2、简单解释:3、Lambda架构的优缺点 二、数据湖基于Hadoop、Spark的实现1、架构2、数据管理(存储层的辅助功能) 一、Lambda架构 1、Lambda的三层架构 Batch View(批处理视图层&#…

文章目录

  • 一、Lambda架构
    • 1、Lambda的三层架构
    • 2、简单解释:
    • 3、Lambda架构的优缺点
  • 二、数据湖基于Hadoop、Spark的实现
    • 1、架构
    • 2、数据管理(存储层的辅助功能)


一、Lambda架构

1、Lambda的三层架构

Batch View(批处理视图层)
Speed Layer(速度层)(实时处理层)
Serving Layer(服务层)

2、简单解释:

  • 1、批处理视图层:负责处理大量的历史数据,生成批处理视图,这个视图通常是基于固定时间间隔(如每天、每小时)对数据进行处理得到的,也就是离线分析的部分
  • 2、速度层:处理实时数据,对最新的数据进行增量计算,补充批处理层的结果
  • 3、服务层:用于合并批处理层和速度层的结果,并将最终的结果提供给用户或其他应用程序(比如MySQL)

总结下来,Lambda架构就是下面三个等式:

# function 就是作用在数据集上的函数
batch view = function(all data)
# 其中参数中的 realtime view 就是不断的对以后的 realtime view 进行迭代更新,知道被 batch view 追上丢弃
realtime view = function(realtime view,new data)
# 服务层就是对 批处理视图 和 实时处理层 的结果进行动态合并
serving layer = function(batch view + realtime view)

3、Lambda架构的优缺点

优点:

  • 成熟稳定、实时计算成本可控、批处理利用了系统空闲时间、将离线和实时分析高峰错开来

缺点:

  • 实时和批处理结果不一致、批量计算无法在有限时间内完成、开发维护困难、中间数据的产生会导致服务器存储开销大

二、数据湖基于Hadoop、Spark的实现

1、架构

[图片]

其中HDFS实现了海量数据存储,Spark、MR、Flink等实现了海量数据分析
所以说,Hadoop生态本质上就是数据湖最合适的实现方案

针对某个业务搭建的数仓可视化平台的架构和这个数据湖架构几乎一样,但是区别就在于数据来源(数仓可视化平台是经过修饰的数据,而数据湖是未被修饰的数据)

2、数据管理(存储层的辅助功能)

  • 数据安全:数据湖中的数据要保证其安全性
  • 审计:对数据进行全面的审查和分析,以确定数据是否符合特定的标准和要求,目前大多数做法就是开启NameNode的审计日志,读取并导入其他日志处理框架中。但是读取NameNode的审计日志比较难,而Delta Lake就很好的做到了这一点。
  • 元数据管理:数据湖中的数据又多又杂,如果没有元数据管理,很容易变成数据沼泽,也就是数据垃圾。
http://www.ds6.com.cn/news/8974.html

相关文章:

  • 怎么找响应式网站互联网企业营销策略
  • 网站seo推广公司靠谱吗武汉网站推广
  • 有经验的企业做网站长沙在线网站的目标客户
  • 网站建设要哪些人不受国内限制的浏览器下载
  • 网站设计机构北大青鸟职业技术学院简介
  • 合肥市建设局网站牛排seo系统
  • 免费数据网站推广策划方案怎么写
  • 广州手机网站定制信息网站托管
  • 哪里有软件培训班百度小程序优化
  • 做博客网站赚钱千锋培训机构官网
  • 大连网站建设比较好的公司淘宝权重查询
  • 小公司做网站赚钱怎么做app推广
  • 锡林浩特网站建设开发成都网站快速开发
  • dw制作简单网站线上营销渠道主要有哪些
  • 聊城做网站的地方不限次数观看视频的app
  • 网站排名怎么靠前今日头条极速版官网
  • 科技网站的一些案例展示肇庆网站制作软件
  • 洛阳青峰网络科技有限公司seo免费培训教程
  • 西乡做网站的公司网站营销软文
  • 郑州网站建设套餐百度一下首页官网
  • 营销技巧在线播放合肥关键词排名优化
  • 给个免费的网站好人有好报推广app软件
  • 沈阳网站seo外包网络推广竞价是什么
  • 1m宽带做网站合肥最新消息今天
  • 模板网站最大缺点餐饮店如何引流与推广
  • 有哪些网站主页做的比较好看网站如何快速被百度收录
  • WordPress可以做社交网站嘛常见的网络营销方式
  • 织梦网站怎么做二级域名百度学术官网
  • 网站建设生产或运营百度查重免费
  • 医疗网站建设平台什么网站都能进的浏览器