google big table(翻译)

google big table(翻译),第1张

google big table(翻译)

Google-Bigtable中文版_1.0.pdf_免费高速下载|百度网盘-分享无限制

关于bigtable 的一些思考:

1.数据如何保证不丢失?

       数据不丢失,数据在写之前先写hlog,再写memory store,尽管region挂了,仍然可以从hlog中恢复。为了提高写性能,并不是将region对应一个hlog,而是一个region server对应一个hlog,且将hlog以64M为界拆分多个file,后台线程对hfile及时索引文件对应的region方便recover。

从memory store,经过min_compaction,major_compaction *** 作刷出的hfile 保存至hdfs,hdfs以副本方式保证了数据不丢失。

2.如何保证数据的一致性?

       数据的一致性,尽管bigtable将数据打散分布到不同的region上。但由于bigtable 在写模式上,采用一条数据只对应一个region(如果熟悉kudu或副本数据库会发现这里的区别),这样保证并发场景下可以保证数据强一致性。是强一致性,不是最终一致性,这里我需要强调一下。

3.与传统关系性数据库的区别?

    显然不支持ACID,只支持当row事务,数据采用LSMT存储(LSMT的论文查看我的历史博文)而不是b-树(大部分关系性数据采用b树存储,b-树的问题是数据update涉及索引的频繁修改,优点也是走索引快),因此big table应用场景在数据写多读少场景,这和关系型数据库不一样的地方,由它的底层索引和数据存储方式决定的。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5696059.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-17
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存