ssis ssas SSRS是BI的三个部分。ETL是数据抽取、清洗、转换、装载的过程,ETL是用SSIS来实现的,也就是说SSIS是ETL工具。而SSAS是建立多维数据集,SSRS是建立前台报表。
微软SQL SERVER 2012 BI体系。
SSIS,数据抽取服务,实现数据Extract,Transfom,Cleansing,Loading,或是按Kimball的说法,进行ECCD 的ETL过程,它实现了从源头提取、数据,清洗数据,一致化数据,加载交付数据到数据仓库这些功能。
另外,在2012中,SSIS还包括了数据质量服务于主数据服务,它们的功用,顾名思义的可以了解到。
SSAS,主要是建立、组织多维数据库,在2012之前,这么说是比较合适的。
在2012及以后,称之为用SSAS建模,分析模型挖掘模型等,会更合适些。2012中包含了传统CUBE模式,和BISM模式的建模,还可以建数据挖掘模型。
SSRS,仍是报表和分析开发。
OLAP核心技术应该分为两种,一是OLAP服务器,或称OLAP引擎,从存储上又分为ROLAP和MOLAP,前者采用关系数据库存储多维数据,后者采用专门多维数据库。二是前端展现工具,基本上包括透视表和透视图,与报表结合后,又拓展出了发布、安全等。
元数据(Meta Date),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、 *** 作和管理能达成协同和一致。
元数据是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。
构建数据仓库的主要步骤之一是ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部数据源,改变数据清洗方法,控制出错的查询以及安排备份等。元数据可分为技术元数据和业务元数据。技术元数据为开发和管理数据仓库的IT 人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据清洗与更新规则、数据映射和访问权限等。而业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。
由上可见,元数据不仅定义了数据仓库中数据的模式、来源、抽取和转换规则等,而且是整个数据仓库系统运行的基础,元数据把数据仓库系统中各个松散的组件联系起来,组成了一个有机的整体。
派可数据,用心创造数据价值 让数据分析更简单
经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的CRM、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的 *** 作,最终对数据库进行增加、修改、删除等 *** 作。上述系统可统一称为OLTP(Online Transaction Process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。
如何把数据库中存在的数据转变为业务人员需要的信息大部分的答案是报表系统。简单说,报表系统已经可以称作是BI了,它是BI的低端实现。
国外的企业,大部分已经进入了中端BI,叫做数据分析。有一些企业已经开始进入高端BI,叫做数据挖掘。而中国的企业,大部分还停留在报表阶段。
数据报表不可取代
传统的报表系统技术上已经相当成熟,大家熟悉的Excel、水晶报表、FineReport、Reporting Service等都已经被广泛使用。但是,随着数据的增多,需求的提高,传统报表系统面临的挑战也越来越多。
1. 数据太多,信息太少
密密麻麻的表格堆砌了大量数据,到底有多少业务人员仔细看每一个数据到底这些数据代表了什么信息、什么趋势级别越高的领导,越需要简明的信息。如果我是董事长,我可能只需要一句话:我们的情况是好、中还是差
2. 难以交互分析、了解各种组合
定制好的报表过于死板。例如,我们可以在一张表中列出不同地区、不同产品的销量,另一张表中列出不同地区、不同年龄段顾客的销量。但是,这两张表无法回答诸如“华北地区中青年顾客购买数码相机类型产品的情况”等问题。业务问题经常需要多个角度的交互分析。
3 难以挖掘出潜在的规则
报表系统列出的往往是表面上的数据信息,但是海量数据深处潜在含有哪些规则呢什么客户对我们价值最大,产品之间相互关联的程度如何越是深层的规则,对于决策支持的价值越大,但是,也越难挖掘出来。
4. 难以追溯历史,数据形成孤岛
业务系统很多,数据存在于不同地方。太旧的数据(例如以前的数据)往往被业务系统备份出去,导致宏观分析、长期历史分析难度很大。
因此,随着时代的发展,传统报表系统已经不能满足日益增长的业务需求了,企业期待着新的技术。数据分析和数据挖掘的时代正在来临。值得注意的是,数据分析和数据挖掘系统的目的是带给我们更多的决策支持价值,并不是取代数据报表。报表系统依然有其不可取代的优势,并且将会长期与数据分析、挖掘系统一起并存下去。
八维以上的数据分析
如果说OLTP侧重于对数据库进行增加、修改、删除等日常事务 *** 作,OLAP(Online Analytics Process,在线分析系统)则侧重于针对宏观问题,全面分析数据,获得有价值的信息。
为了达到OLAP的目的,传统的关系型数据库已经不够了,需要一种新的技术叫做多维数据库。
多维数据库的概念并不复杂。举一个例子,我们想描述2003年4月份可乐在北部地区销售额10万元时,牵扯到几个角度:时间、产品、地区。这些叫做维度。至于销售额,叫做度量值。当然,还有成本、利润等。
除了时间、产品和地区,我们还可以有很多维度,例如客户的性别、职业、销售部门、促销方式等等。实际上,使用中的多维数据库可能是一个8维或者15维的立方体。
虽然结构上15维的立方体很复杂,但是概念上非常简单。
数据分析系统的总体架构分为四个部分:源系统、数据仓库、多维数据库、客户端。
·源系统:包括现有的所有OLTP系统,搭建BI系统并不需要更改现有系统。
·数据仓库:数据大集中,通过数据抽取,把数据从源系统源源不断地抽取出来,可能每天一次,或者每3个小时一次,当然是自动的。数据仓库依然建立在关系型数据库上,往往符合叫做“星型结构”的模型。
·多维数据库:数据仓库的数据经过多维建模,形成了立方体结构。每一个立方体描述了一个业务主题,例如销售、库存或者财务。
·客户端:好的客户端软件可以把多维立方体中的信息丰富多彩地展现给用户。
数据分析案例:
在实际的案例中,我们利用Oracle 9i搭建了数据仓库,Microsoft Analysis Service 2000搭建了多维数据库,ProClarity 60 作为客户端分析软件。
分解树好像一个组织图。分解树在回答以下问题时很有效:
·在指定的产品组内,哪种产品有最高的销售额
·在特定的产品种类内,各种产品间的销售额分布如何
·哪个销售人员完成了最高百分比的销售额
数据挖掘看穿你的需求
广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是BI。但从技术术语上说,数据挖掘(Data Mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。
关联销售案例:
美国的超市有这样的系统:当你采购了一车商品结账时,售货员**扫描完了你的产品后,计算机上会显示出一些信息,然后售货员会友好地问你:我们有一种一次性纸杯正在促销,位于F6货架上,您要购买吗
这句话决不是一般的促销。因为计算机系统早就算好了,如果你的购物车中有餐巾纸、大瓶可乐和沙拉,则86%的可能性你要买一次性纸杯。结果是,你说,啊,谢谢你,我刚才一直没找到纸杯。
这不是什么神奇的科学算命,而是利用数据挖掘中的关联规则算法实现的系统。
每天,新的销售数据会进入挖掘模型,与过去N天的历史数据一起,被挖掘模型处理,得到当前最有价值的关联规则。同样的算法,分析网上书店的销售业绩,计算机可以发现产品之间的关联以及关联的强弱。
数据报表、数据分析、数据挖掘是BI的三个层面。我们相信未来几年的趋势是:越来越多的企业在数据报表的基础上,会进入数据分析与数据挖掘的领域。商业智能所带来的决策支持功能,会给我们带来越来越明显的效益。
以上就是关于ETL和ssis ssas ssrs是个什么关系全部的内容,包括:ETL和ssis ssas ssrs是个什么关系、1.olap实现的关键技术有哪些、数据库元数据的分类等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)