hbase架构

hbase架构,第1张

hbase架构

 

 

Data:get, put, delete(某一行数据 *** 作)

Region:splitRegion(切分), compactRegion(合)

Master: 元数据入口,可以理解为管理表结构。DDL 数据库模式定义语言DDL(Data Definition Language)

ReginServer: DML 数据 *** 纵语言(Data Manipulation Language, DML)是用于数据库 *** 作

HRegion超过 256M 就要被分割成两个,由 HRegionServer管理,管理哪些HRegion由HMaster分配。
现在我们来介绍一下Hbase中的一些组成部件以及它们起到的作用:

Client:包含访问Hbase的接口,并维护cache来加快对Hbase的访问。

Zookeeper:Hbase依赖Zookeeper,默认情况下Hbase管理Zookeeper实例(启动或关闭Zookeeper),Master与RegionServers启动时会向Zookeeper注册。Zookeeper的作用如下:

保证任何时候,集群中只有一个master
存储所有Region的寻址入口
实时监控Region server的上线和下线信息。并实时通知给master
存储Hbase的schema和table元数据
HRegionServer:用来维护master分配给他的region,处理对这些region的io请求;负责切分正在运行过程中变的过大的region。

HRegion:Hbase表在行的方向上分隔为多个Region。Region是Hbase中分布式存储和负载均衡的最小单元,即不同的region可以分别在不同的Region Server上,但同一个Region是不会拆分到多个server上。Region按大小分隔,每个表一般是只有一个region,当region的某个列族达到一个阈值(默认256M)时就会分成两个新的region。

Store:每一个Region由一个或多个Store组成,至少是一个Store,Hbase会把一起访问的数据放在一个Store里面,即为每个ColumnFamily建一个Store,如果有几个ColumnFamily,也就有几个Store。一个Store由一个memStore和0或者多个StoreFile组成。Store的大小被Hbase用来判断是否需要切分Region。

StoreFile:memStore内存中的数据写到文件后就是StoreFile,StoreFile底层是以HFile的格式保存。
HLog:HLog记录数据的所有变更,可以用来恢复文件,一旦region server 宕机,就可以从log中进行恢复。

LogFlusher:一个LogFlusher的类是用来调用HLog.optionalSync()的。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/zaji/5679496.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存