hana数据库与数据仓库区别分别是:
数据库(Database)是:
1、相对复杂的表格结构,存储结构相对紧致,少冗余数据。
2、读和写都有优化。
3、相对简单的read/write query,单次作用于相对的少量数据。
数据仓库(Datawarehouse)是:
1、相对简单的(Denormalized)表格结构,存储结构相对松散,多冗余数据。
2、一般只是读优化。
3、相对复杂的read query,单次作用于相对大量的数据(历史数据)。
并且数据库 Database (Oracle, Mysql, PostgreSQL)主要用于事务处理,数据仓库 Datawarehouse (Amazon Redshift, Hive)主要用于数据分析。
数据仓库的弱势之处是:
并不是所有的读 *** 作,数据仓库一直都有优势。比如在如下两种情况时,数据仓库的读表现并不如数据库:
1、在对小量数据进行读取 *** 作的时候,由于数据仓库要进行找Node的location之类的预运算,整体效率上反倒不如数据库。
2、如果读取 *** 作的目标不是主键(PrimaryKey)或者分配键(PartitionKey),那么数据仓库的查询也需要进行全局扫描,效率上就不好说是否胜过数据库了。
hana 需要3台服务器。
sap内存计算技术,hana一个软硬件结合的产品,硬件是专门的hana服务器(其他服务器是不能用的),软件也就是数据库是sap。
用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。用户拿到的是一个装有预配置软件的设备。至于HANA的云服务,只是对用户而言可以在不购买相关硬件的情况下享受HANA的高性能,而HANA云服务的背后还是需要更高性能的硬件支撑的。
hana软件方面:
HANA的内存数据库(SAP In-Memory Database, IMDB)是其重要组成部分,包括数据库服务器(In-Memory Database Server)、建模工具(Studio)和客户端工具(ODBO、JDBC、ODBC、SQLDBC等)。
HANA的计算引擎(Computing Engine)是其核心,负责解析并处理对大量数据的各类CRUDQ *** 作,支持SQL和MDX语句、SAP和non-SAP数据。比较显而易见的一点是,HANA计算引擎要快速处理用户复杂的查询请求,快速返回查询结果。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)