亲,Smartbi是国内老牌BI厂商,企业级商业智能应用平台,经过多年的持续发展,凝聚了多年的商业智能最佳实践经验,整合了各行业的数据分析和决策支持的功能需求,产品和技术实力毋庸置疑的 但是smartbi需要装很多插件, *** 作也比较复杂,所以学习成本比较高。 如果您是找敏捷bi平台的话 ,其他的也不错,比如finebi,BDP,永洪bi,DataFocus等,这几家性价比也不错。 如果您是找数据分析平台的话可以先举几个大家比较熟悉的平台 1 EMC—Greenplum:迎战大数据 EMC Greenplum统一分析平台(UAP) Greenplum是一款单一软件平台,数据团队和分析团队可以在该平台上无缝地共享信息、协作分析,没必要在不同的孤岛上工作,或者在不同的孤岛之间转移数据。 2 IBM打组合拳提供BigInsights和BigCloud IBM发新产品应对大数据使组织内的任何用户都可以做大数据分析。云上的BigInsights软件可以分析数据库里的结构化数据和非结构化数据,使决策者能够迅速将洞察转化为行动。 3 Informatica 91:将大数据的挑战转化为大机遇 Informatica提供首款Hadoop编译器软件支持灵活高效地处理Hadoop里面的任何文件格式,为Hadoop开发人员提供了即开即用的解析功能,以便处理复杂而多样的数据源,包括日志、文档、二进制数据或层次式数据,以及众多行业标准格式(如银行业的NACHA、支付业的SWIFT、金融数据业的FIX和保险业的ACORD)。正如数据库内处理技术加快了各种分析方法,Informatica同样将解析代码添加到Hadoop里面,以便充分利用所有这些处理功能。 4 惠普——Vertica数据分析平台,被惠普收购的Vertica,是能提供高效数据存储和快速查询的列存储数据库实时分析平台。该数据库还支持大规模并行处理(MPP)。在收购之后,惠普随即推出了基于x86硬件的HP Vertica。通过MPP的扩展性可以让Vertica为高端数字营销、电子商务客户(比如AOL、Twitter、 Groupon)分析处理的数据达到PB级。 希望我的回答对您有帮助哦
MPP的代表产品有:Vertica/Redshift(Paracel,被Amazon买买下了源码的license后变成Redshift)/Greenplum。仔细观察不难发现,这三者其实有非常很多相同点:
1全部基于PostgreSQL
2都是基于列的存储(Columnar Storage)
3 *** 作都是以Scan为基础,依赖Compression来提供性能的优化
针对百T级别的实时数据,一些适合的数据库包括:
1 Apache Cassandra:Cassandra是一个开源的分布式NoSQL数据库,可以实现水平扩展,支持百T级别的数据存储和读取,并且具备高可用性和高性能。
2 Apache HBase:HBase是一个分布式的NoSQL数据库,特别适合存储大规模的结构化数据,并且可以提供实时读写 *** 作。它可以与Hadoop生态系统中的其他组件(如Hadoop、Hive和Pig)集成,支持海量数据的处理和分析。
3 MongoDB:MongoDB是一个基于文档的NoSQL数据库,支持高性能、高可用性和高扩展性,并且可以实现水平扩展。它还具有灵活的数据模型和强大的查询能力,适用于大规模的数据存储和处理。
4 Apache Druid:Druid是一个开源的分布式实时数据存储和查询系统,可以支持百T级别的数据存储和实时查询。它主要用于OLAP(在线分析处理)场景,可以提供快速的数据分析和查询功能。
需要注意的是,选择数据库时需要考虑到数据的类型、数据量、性能要求、数据一致性、容错性等因素,结合具体需求进行选择。
vertica 无 master 全部机都是master 而 greeplum 只能有一台master,然后做一个master的备份。
这是对程序应用的稳定性起了最关键的作用。gp master关了,然后就不能连了。。要手动切换到master的备份。而vertica 3台机做一个备份策略的话,连接时写上三个节点的ip就不会挂。
现在国内做得最后的还有南大通用的g8,他是学vertica的。不过他所为的“组”比较坑。加大了安全风险。
执行速度对比。vertica能秒杀一切mpp。毕竟是数据库发明者开发的。。而且安装简单90M多的数据库。缺点就是太贵太贵了。一个T数据要15万左右。而且是按入库前的大小。vertica 进库后是会压缩10倍的。如果数据不多。1个T左右,可以使用vertica的社区版。功能一样,3台x86秒杀500万的p570 oracle
greenplum与vertica都是基于postgresql开发的,语法与oracle 有95%以上的相似。什么to_date,to_char等。而g8是基于mysql语法的。
MAX_UTILIZATION代表数据库自上次启动以来达到的最大值,LIMIT_VALUE代表设置的最大值
select resource_name,MAX_UTILIZATION,LIMIT_VALUE from v$resource_limit where resource_name in ('processes','sessions')!
以上就是关于新型数据分析系统有哪些全部的内容,包括:新型数据分析系统有哪些、mpp架构数据库有哪些、百t级别实时数据使用什么数据库合适等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)