Hbase行健列族的概念,物理模型,表的设计原则?

Hbase行健列族的概念,物理模型,表的设计原则?,第1张

Hbase行健列族的概念,物理模型,表的设计原则

行健:是hbase表自带的,每个行健对应一条数据。 列族:是创建表时指定的,为列的集合,每个列族作为一个文件单独存储,存储的数据都是字节数组,其中的数据可以有很多,通过时间戳来区分。 物理模型:整个hbase表会拆分为多个region,每个region记录着行健的起始点保存在不同的节点上,查询时就是对各个节点的并行查询,当region很大时使用.meta表存储各个region的起始点,-ROOT又可以存储.meta的起始点。 rowkey的设计原则:各个列簇数据平衡,长度原则、相邻原则,创建表的时候设置表放入regionserver缓存中,避免自动增长和时间,使用字节数组代替string,最大长度64kb,最好16字节以内,按天分表,两个字节散列,四个字节存储时分毫秒。 列族的设计原则:尽可能少(按照列族进行存储,按照region进行读取,不必要的io *** 作),经常和不经常使用的两类数据放入不同列族中,列族名字尽可能短。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/4878585.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-11-11
下一篇 2022-11-11

发表评论

登录后才能评论

评论列表(0条)

保存