目前市面上有各种BI专用工具,功能和性能都包装的很精美。然而,在具体的应用中,人们通常更关注简单的技术特征和解决方案。针对大数据,未来的应用和发展趋势不可抗拒,很多公司也有大数据分析和解决的需求。下面介绍三款市面上比较流行的BI系统软件,讨论“大数据”的特点,主要是与Hadoop、Spark、多维分析数据库的连接和性能。
Tableau的大数据战略
1.目前,Tableau可用的大数据生态系统连接包括:
Hadoop:ClouderaImpala和Hive、HortonworksHive、MapRHive、AmazonEMRforImpala和Hive、PivotalHAWQ、IBMBigInsights
NoSQL:MarkLogic、Datastax
Spark:ApacheSparkSQL
多维分析数据库:TeradataAster、HPVertica、SAPHana、SAPSybase、PivotalGreenplum
2.Tableau可以立即连接到数据库或添加到运行内存中。快速交互搜索分析时,即时连接非常有效。但是因为运行内存分析,对硬件配置要求更高,信息量大的时候效率会更低。
3.面向业务流程客户的大数据自助数据可视化。业务客户可以通过拖动实际 *** 作数据来可视化他们的数据信息,而不是编写复杂的SQL、Java编码或MapReduce工作。Tableau简化了日常分析数据信息的任务,客户可以比以前更快地从数据信息中找出品牌形象。
FineBI的两个大数据计划
1.适用于FineBI的大数据生态系统连接包括
大数据服务平台:Vertica、GreenPlum、ApacheKylin、Impala/hive、hive、StarRing、
没有SQL数据库:MongoDB
多维分析数据库:Teradata、SAPHana、Greenplum、SAPSybase
2.FineBI应用了FineIndex和FineDirect两种数据信息连接和解决方法,解决不同的数据信息方案。
FineDirect解决了一些必须执行才能呈现结果的问题,比如金融机构交易风险的流水分析,即时连接hadoop、kylin、greenplum等大数据服务平台。
FineIndex选择cube连接,换句话说就是数据库-FineIndex-前端开发分析。FineIndex相当于一个中间数据库,用来存储数据分析表、关系型转义数据库索引等。这些都大大提高了事后前台分析解决数据信息的效率(由于是即时sql访问,所以高效率受到数据库本身的限制,当信息量较大时,一般的分析专用工具非常容易卡顿,促使内存溢出,可能导致无响应)
3.用于跨数据库分析的数据信息混合。FineBI可以将大数据与其他数据库(如MySQL、Excel文档等)混合使用。),以便客户可以访问各种数据库之外的数据,并将它们合并到一个FineIndex中。
软件
1.Qlikview也是基于运行内存的BI,可以即时响应客户的分析需求。与Tableau类似,性能主要由数据库决定。它可以立即从客户的业务管理系统中收集数据并进行多维分析,消除了传统BI只能按照数据库管理(bazaar)来实现的弊端(创作者并没有从互联网及其信息库中找到太多关于大数据的论述,官网也没有这些方面的宣传和策划)。
2.QlikView的关键是获得专利的AQL架构。在分析中,不使用传统的OLAP立方体,也不需要数据库。基础的云 *** 作系统被彻底用来分析数以亿计的数据信息。QlikView使用一个长宽比数据、完整功能和创造性的可视化各种终端产品的方法,交互地交换和分析关键业务流程的信息内容。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)