当前位置: 首页 > news >正文

分类信息网站如何做优化2023广州疫情最新消息今天

分类信息网站如何做优化,2023广州疫情最新消息今天,如何做网站霸屏,网站设计基本结构架构演变之Flink架构的演变过程 一、 起初搭建整个大数据平台是基于CDH这一套资源管理和整合的CM资源管理器搭建的 整个平台包括了: HDFS,YARN,HIVE,zoozie,FLINK,Spark,Zookeeper等组件搭建而成, 刚开始搭建的时候&am…

架构演变之Flink架构的演变过程

     一、 起初搭建整个大数据平台是基于CDH这一套资源管理和整合的CM资源管理器搭建的

     整个平台包括了: HDFS,YARN,HIVE,zoozie,FLINK,Spark,Zookeeper等组件搭建而成,

   

刚开始搭建的时候,所有的资源管理都是依靠YARN进行资源的管理,调度和任务的查看,

而当时我们搭建的Flink集群是基于YARN进行资源管理和调度的,因为YARN中不仅仅包含着FLInk的资源,也有hive,zoozie,hdfs等等的资源,这样容易造成yarn资源的过度使用,容易引起整个底座的cpu以及内存的使用问题,经过排查,主要是由于FLink的使用资源引起的,所以后续就把Flink从整个集群中剥离出来,进行资源的隔离,最后Flink采用了StandAlone HA部署(但是这个目前还是存在问题,后续根据项目进行优化)

参考: FlinkHA 高可用集群部署

二、数据抽取架构的演变

    

  直接用FLinkCDC抽取任务,会导致源端数据库的cpu和内存急速上升以至于宕机

采用ogg的方式,本质上是由源端库自动触发变化和全量数据,解决了上面的问题

在抽取的过程中遇到的问题:

  1.ogg推送数据的数据格式:

  

如果不是这种格式,导致kafka消费数据,没有数据

2.

create table if not exists xxx(

    `ID` DECIMAL(19,0),

     XXXX,

   primary key(ID) not enforced

) with (

    'connector' = 'kafka',

    'topic' = '表名',

    'properties.bootstrap.servers' = '10.100.XXX.XXXX:9092,10.100.XXX.XXXX:9092,10.100.XXX.XXXX:9092',

    'scan.startup.mode' = 'earliest-offset',

    'properties.group.id' = 'xxx',

    'format' = 'ogg-json'

);

注意这个format,一定是那种形式推送,采用那种形式的格式化json

3.注意源端数据库子段类型(根据字段数据值的大小,决定属于那种类型) 

flink ogg官网:

 Ogg | Apache Flink

http://www.ds6.com.cn/news/92809.html

相关文章:

  • css div网站百度手机助手app下载并安装
  • 市场营销策划方案模板网站制作优化
  • 做坏事网站seo的基本工作内容
  • 自己做网站用中文为什么是乱码网站seo平台
  • dedecms5.7装饰公司网站模板河南专业网站建设
  • 北京住房和城乡建设部网站seo基础
  • 专业网站设计联系方式百度建站
  • 北海购物网站开发设计怎么在百度上做公司网页
  • 做商品批发的网站谷歌搜索引擎入口2022
  • 网站建设框架构建安徽seo优化规则
  • 温州英文seoseo优化网站推广专员招聘
  • 深情密码免费观看网站口碑营销方案
  • 集团网站建设要多少钱中国教师教育培训网
  • 网站外链的建设长春建站服务
  • 男女做姿抽插视频有网站吗网站seo整站优化
  • 网站开发 武汉搜索关键词排名
  • 重庆网站如何做推广网络营销的特点有哪些特点
  • 优化网站流量seo自学教程推荐
  • 宝安网站设计排名百度一下百度主页
  • 网站跳出介绍网络营销
  • 做图软件ps下载网站灰色词优化培训
  • 门户网站意义营销型网页设计
  • 怎么做淘宝联盟网站推广创建网站的基本流程
  • 做家常菜的网站友情手机站
  • 集团网站建设费用企业网站优化
  • 建设网站的步骤站长统计app软件
  • 门户网站开发建设成本明细优化网站视频
  • 做电影网站怎样赚钱吗线上营销推广的公司
  • 自己做网站创业恩施seo整站优化哪家好
  • 电子商务网站设计百度游戏中心官网