HBase✧详解_随笔

HBase✧详解 Hbase详解

一、Hbase优点

容量大：
Hbase单表可以有百亿行、百万列，数据矩阵横向和纵向两个维度所支持的数据量级都非常具有d性面向列：
面向列的存储和权限控制，并支持独立检索，可以动态增加列，即，可单独对列进行各方面的 *** 作列式存储，其数据在表中是按照某列存储的，这样在查询只需要少数几个字段的时候，能大大减少读取的数量多版本：
Hbase的每一个列的数据存储有多个Version，比如住址列，可能有多个变更，所以该列可以有多个version稀疏性：
为空的列并不占用存储空间，表可以设计的非常稀疏。不必像关系型数据库那样需要预先知道所有列名然后再进行null填充拓展性：
底层依赖HDFS，当磁盘空间不足的时候，只需要动态增加datanode节点服务(机器)就可以了高可靠性：
WAL机制，保证数据写入的时候不会因为集群异常而导致写入数据丢失Replication机制，保证了在集群出现严重的问题时候，数据不会发生丢失或者损坏Hbase底层使用HDFS，本身也有备份。高性能：
底层的LSM数据结构和RowKey有序排列等架构上的独特设计，使得Hbase写入性能非常高。
Region切分、主键索引、缓存机制使得Hbase在海量数据下具备一定的随机读取性能，该性能针对Rowkey的查询能够到达毫秒级别，LSM树，树形结构，最末端的子节点是以内存的方式进行存储的，内存中的小树会flush到磁盘中（当子节点达到一定阈值以后，会放到磁盘中，且存入的过程会进行实时merge成一个主节点，然后磁盘中的树定期会做merge *** 作，合并成一棵大树，以优化读性能。）LSM树的介绍

二、Hbase读写流程

1、公共读写流程解析

大致流程图如下，后面分别对0.96之前和之后版本进行文字赘述

① Hbase0.96版本之前

首先无论是读还是写都先去zookeeper中获取-root-（-root-文件单独存放在一个HRegion中）文件所在HRegionServer的位置信息，而-root-表中存放的是.meta.文件在HRegion中的映射位置，因为.meta.文件也是需要依RowKey进行切分，分别存放在HRegion中。.meta.文件中存放则RowKey与HRegion和HRegion与HRegionServer的映射关系，这样无论是读写，都可以通过RowKey的映射关系找到存放着文件的多个HRegion的位置。

② Hbase0.96版本之后

0.96版本之后，取消了-root-文件，直接将-root-文件里的映射信息直接存放到zookeeper中。

2、读流程详解

① 客户端先访问zookeeper,获取meta文件所在的HRegionServer（BlockCache公共区域，可以设置）的位置
② 访问meta对应的HRegionServer，加载meta加载到内存，在通过查询的RowKey获取对应HRegion的映射关系
③ 获取映射关系后，进行数据请求，由于数据分在多个HRegion所以对应创建多个HRegionScanner通道进行检索数据。
④ 检索先从MemStore中检索，失败后在去StoreFile（内部有序外部无序）中检索，最后经过检索过滤合并，获得最后的keyValue。

3、写流程详解

① 首先客户端会与HRegionServer建立连接。
② 会将写入 *** 作写入到HLog日志中（WAL机制）,在进行具体的写入 *** 作至store（MemStore中）。
③ MemStore默认128M,一个store对应一个列簇，一旦满了，就会申请新的MemStore，而旧的则会被HRegionServer启动flushCache刷到硬盘（HDFS)。
④ 刷到硬盘上形成的文件变成StoreFile文件（底层格式是HFile),当SF文件越来越多，则会进行合并，合并成一个大的StoreFile文件，相邻的StoreFile也会启动合并。

三、Hbase刷写

1、Hbase数据刷写的时机

MemStore的阈值128M,但内存占用达到512M时阻塞客户端的写入（MemStore会堵塞）HRegionServer总内存的阈值，总内存*40%*95%开始刷写(当达到flush级别则HRegionServer整个会堵塞）Wal日志机制的阈值，也就是在某种情况下，日志越来越多，也就意味着MemStore中为持久化的数据越来越多，导致HRegionServer挂掉，所以在Wal达到一定数量进行刷出自定义刷写的时间间隔手动刷写=命令刷写

2、Hbase刷写策略

hbase1.1版本
此时的MemStore的刷写级别是HRegion的，也就是说一个MemStore要刷写，那么整个HRegion中的其他MemStore都要一起刷写（所以列簇不要太多不要超过三个）。hbase2.x版本
还是对HRegion中全部的MemStore进行刷写，不过设置了阈值的判断，大于阈值的将会被刷写。

3、Hbase刷写流程

prepareFlush 阶段：
准备刷出阶段，会将MemStore文件创建一个snapshot,为了在创建snapshot时写入造成错误，所以在创建snapshot时携带一个updateLock锁，创建snapshot很快，不受影响。flushCache 阶段：
判断快照是否有问题，返回result=null没问题则进行刷出缓存和提交即可。

四、Hbase合并

1、Hbase数据合并(Compaction)

Minor Compaction
将小的相邻的FileStore进行合并，但不会对已经失效的数据进行删除，会对超过TTL(生存期的数据进行处理），减少小数据Major Compaction
将所有的FileStore进行合并，并对三无数据进行处理，速度较慢占用大量资源，对上层应用造成影响，一般关闭此功能，都是手动开启（清理三类无意义数据：被删除的数据、TTL过期数据、版本号超过设定版本号的数据。）

2、合并时机

Memstore Flush
Store的StoreFile文件树进行判断，判断是否达到合并的阈值（文件数量为10个）周期性检测
默认定义一个合并的周期，如果达到阈值也会检查文件的数目，如果文件超过3个—小合并，不超过三个，检查最早一次合并的时间，超过七天会进行大合并手动触发
在低峰期的时候手动开启major compaction进行Filestore的全部合并与数据清理

3、合并策略

选择线程
默认值为2 * maxFlilesToCompact * hbase.hregion.memstore.flush.size
超过则用longcompaction，处理小规模用SortcompactionMinor合并
Hbase 主要有两种 minor 策略: RatiobasedCompactionPolicy (0.96.x之前)和ExploringCompactionPolicy(当前默认)
① RatiobasedCompactionPolicy(基于比列的合并策略):比较大一些的都不会进行合并
② ExploringCompactionPolicy策略(默认策略)

五、数据切分(Region Split)

1、切分原因

① 数据分布不均匀
导致一个HRegion中分配了很多请求，导致效率大大减低② compaction性能损耗严重
主要用于排序合并，一旦文件过大，导致占用大量资源，并且处理较慢，导致资源损耗严重③ 资源耗费严重
Hbase每天的写入量很大，如果不进行数据切分存储，很快单点资源就会被占用耗尽

2、切分时机

当每次的数据合并后，对应Region会有一个requestSplit请求，会首先检查filesize是否达到阈值，超过进行切分

① ConstantSizeRegionSplitPolicy（ 0.94版本）
也就HRegion内达到10G② IncreasingToUpperBoundRegionSplitPolicy：
如果store大小大于一个变化的阀值就允许split

3、切分流程⭐

① 寻找切点
首先寻找切点，先遍历HRegion中的FileStore文件，找到最大的FileStore文件，在从中找到最大的Rowkey数据，作为切点
Hbase将整个切分过程包装成了一个事务，意图能够保证切分事务的原子性② 三个阶段
prepare准备阶段
先创建连个子HRegion（具体是创建了HRegionInfo对象，里面存放表名，HRegion名等），准备存放切分后的数据，还会创建一个transaction journal，进行记录切分的进展
execute执行阶段
首先HRegionServer会更改ZK中HRegion节点的状态为Spliting,此时HMaster就会检查到HRegion的状态，便会修改内存中HRegion的状态，子HRegion会在父目录下创建一个.split临时目录存放子HRegion的信息，父HRegion关闭写入，将数据写出持久化，此后这段时间访问父HRegion的请求都会抛出异常，核心分裂步骤：在.split文件夹下新建两个子文件夹，称之为daughter A、daughter B，并在文件夹中生成reference文件，分别指向父region中对应文件。最后父HRegion将两个子HRegion移到Hbase根目录下开始服务，待子HRegion工作则删除父HRegion
rollback回滚阶段
如果execute阶段出现异常，则执行rollback *** 作。为了实现回滚，整个切分过程被分为很多子阶段，回滚程序会根据当前进展到哪个子阶段清理对应的垃圾数据。

六、表设计

1、行健设计

① 长度原则
Rowkey 是一个二进制码流，最大长度是64KB，建议越短越好。10-100长度即可，不要超过 16 个字节。（占用资源）② 散列原则
尽量将连续数据存放到更多的RegionServer（不然容易RowKey堆积到一个节点上）③ 唯一原则
必须在设计上保证其唯一性④ 热点数据
RowKey反转，加演算法，Hash算法都可以解决（就是数据堆积）RowKey反转 xxx01 xxx02 02xxx 01xxx ,或者加盐，进行平均分配，也可加随机数但不好查找

2、列簇设计

尽可能少和短列簇HFIle块默认是64KB，数据库的大小影响数据库的索引的大小

总结

欢迎分享，转载请注明来源：内存溢出

原文地址: https://outofmemory.cn/zaji/5700135.html

HBase✧详解

发表评论

评论列表（0条）