hana数据库与数据仓库区别分别是:
数据库(Database)是:
1、相对复杂的表格结构,存储结构相对紧致,少冗余数据。
2、读和写都有优化。
3、相对简单的read/write query,单次作用于相对的少量数据。
数据仓库(Datawarehouse)是:
1、相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
2、一般只是读优化。
3、相对复杂的read query,单次作用于相对大量的数据(历史数据)。
并且数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。
数据仓库的弱势之处是:
并不是所有的读 *** 作,数据仓库一直都有优势。比如在如下两种情况时,数据仓库的读表现并不如数据库:
1、在对小量数据进行读取 *** 作的时候,由于数据仓库要进行找Node的location之类的预运算,整体效率上反倒不如数据库。
2、如果读取 *** 作的目标不是主键(PrimaryKey)或者分配键(PartitionKey),那么数据仓库的查询也需要进行全局扫描,效率上就不好说是否胜过数据库了。
因为sap一直使用甲骨文的数据库,而两家在市场是竞争对手,所以sap迫切要求拥有自己的数据库这就是hana出现的原因。简单说hana就是所有的字段都是key字段,(增加了检索的速度),形象说就是横着看,竖着看,都有KEY
hana数据库运行时,数据保存在内存中,这样可以跳过硬盘,
计算机技术目前的瓶颈就是内存->总线->硬盘。其中大量的时间消耗在总线上了。
这样一来hana检索数据的效率比较快。
再要具体的,就不是一句两句能说完的了,你需要去看SAP的资料
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)