BHbase是分布式的数据库, 可以通过不断增加服务器,来增加计算和存储能力
CHbase中一个存贮单元可以保存同一份数据的多个版本
A是错的,hbase是面向列的存储
D hbase可扩展性和海量数据存储,恰恰可以用在高并发场景。1使用xshell或者crt等工具连接到hbase所在的服务器
2然后通过ls查找到hbase
3然后cd
切换到hbase目录下
4bin/start-hbasesh
5bin/hbase
shell
6list
查看该用户下的所有表格由图中可以看出,存储模块主要包括了ZooKeeper集群、HMaster、HRegionServer。
ZooKeeper:
Hbase是强依赖于ZooKeeper,我们读或写一个表的数据,都会优先访问ZooKeeper。
通常是集群中单独的3/5台服务器。
HMaster通常是Hadoop集群中的一台或两台(backup-Master)。
HRegionServer通常是Hadoop集群中的部分或全部
HRegionServer通常和datanode部署在同一台服务器上
比如datanode是10个
HRegionServer可以是10个或小于10个
2、hbase架构图重要组件的名称及作用
client:
读/写访问hbase的用户
ZooKeeper:
基于观察者模式监控master和regionserver运行状态,保证hbase的高可用性,这是因为hbase是强依赖于ZooKeeper的。
存储了hbase的寻址入口
存储了hbase表的meta元数据表的位置信息
Meta也是一张表,meta表一般只有一个region
region存在哪台regionserver上
meta元数据表存储了哪些信息:
一张表有哪些reigon
region分别分配到哪些regionserve上r
每个reigon的startkey和stopkey的大小
master:
管理regionserver并分配表的region给regionserver
对集群的region的数量进行负载均衡管理
master会借助ZooKeeper感知regionserver的上线和下线
master一般会有两台(backup-Master),保证master的高可用性
master不参与hbase表数据的读和写,负载通常比较低
master宕机一段时间内集群可以保持正常的读写
regionserver:
管理所在服务器节点上的所有region
负责响应客户端的读写请求(IO)
三大机制(flush、compact、split)
Hlog:
预写日志
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)