OushuDB 的主要功能_随笔

OushuDB 的主要功能

极速执行器: 高效的执行器，比传统数仓/MPP快5-10倍，比Hadoop SQL引擎要快5-30倍。

公有云和私有云部署：支持亚马逊和阿里云等公有云平台，同时可以支持主流PaaS云平台（比如Kubernetes等）和Docker部署。

对标准的完善支持：ANSI SQL标准，OLAP扩展，标准JDBC/ODBC，比Hadoop SQL引擎都要完善。

具有非常成熟的并行优化器。优化器是并行SQL引擎的重要组成部分，对性能影响很大，尤其是对复杂查询。

支持ACID事务特性：这是很多现有基于Hadoop的SQL引擎做不到的，对保证数据一致性很重要。可以有效减少开发及运维人员的负担。

动态数据流引擎：基于UDP的高速互联网络。

d性调度执行：可以根据查询大小来决定执行查询使用的节点及Segment个数。

支持多种分区方法及多级分区：支持List分区和Range分区。分区表对性能有很大提升作用，如果用户只想访问最近一个月的热数据，查询只需要扫描最近一个月数据所在分区。

支持多种压缩方法：snappy，gzip，zlib, zstd, lz4, RLE等。

多种存储过程语言支持：python, c/c++, perl等。

动态扩容：动态按需扩容，按照存储大小或者计算需求，秒级添加节点。

多级资源和负载管理：和外部资源管理器YARN集成；可以管理CPU，Memory资源等；支持多级资源队列；具有方便的DDL管理接口。

支持访问任何HDFS及其他系统的数据：各种HDFS格式（文本，ORC等等）以及其他外部系统（Hive等），并且用户自己可以开发插件来访问新的数据源。

原生的机器学习数据挖掘库MADLib支持：易于使用及高性能。

与Hadoop系统无缝集成：存储、资源、安装部署、数据格式和访问等。

完善的安全及权限管理：kerberos；数据库，表等各个级别的授权管理。

支持多种第三方工具：比如Tableau，SAS，较新的Apache Zeppelin等。

欢迎分享，转载请注明来源：内存溢出

OushuDB 的主要功能