表格、 多维和数据挖掘是SQL Server Analysis Services 提供用于创建商业智能语义模型的两种方法,还有一种方法是 Power Pivot for SharePoint。
可以使用多种方法来实现针对不同业务和用户需求量身定制的建模体验。 “多维”是建立在开放标准基础之上的成熟技术,已由 BI 软件的众多供应商采用,但难以驾驭。 “表格”提供一种关系建模方法,很多开发人员认为它更加直观。
所有模型将部署为在 Analysis Services 实例上运行的数据库,可以使用一套数据提供程序通过客户端工具来访问,并通过 Excel、Reporting Services、Power BI 和其他供应商的 BI 工具在交互式静态报告中可视化。
表格和多维解决方案使用 SSDT 构建,旨在用于在独立上运行的公司 BI 项目 Analysis Services实例在本地和表格模型中, Azure Analysis Services中的服务器云。 这两个解决方案将生成可与 BI 客户端轻松集成的高性能分析数据库。 然而,每个解决方案在创建、使用和部署方式上都存在不同。本主题的大部分内容比较了这两种类型,以方便你找到适当的方法。
一、概述
多维数据模型是最流行的数据仓库的数据模型,多维数据模型最典型的数据模式包括星型模式、雪花模式和事实星座模式,本文以实例方式展示三者的模式和区别。
二、星型模式(star schema)
星型模式的核心是一个大的中心表(事实表),一组小的附属表(维表)。星型模式示例如下所示:
三、雪花模式(snowflake schema)
雪花模式是星型模式的扩展,其中某些维表被规范化,进一步分解到附加表(维表)中。雪花模式示例如下图所示:
从图中我们可以看到地址表被进一步细分出了城市(city)维。supplier_type表被进一步细分出来supplier维。
四、事实星座模式(Fact Constellation)或星系模式(galaxy schema)
数据仓库由多个主题构成,包含多个事实表,而维表是公共的,可以共享,这种模式可以看做星型模式的汇集,因而称作星系模式或者事实星座模式。本模式示例如下图所示:
如上图所示,事实星座模式包含两个事实表:sales和shipping,二者共享维表。
五、总结
事实星座模式是数据仓库最长使用的数据模式,尤其是企业级数据仓库(EDW)。这也是数据仓库区别于数据集市的一个典型的特征,从根本上而言,数据仓库数据模型的模式更多是为了 避免冗余和数据复用 ,套用现成的模式,是设计数据仓库最合理的选择。当然大数据技术体系下,数据仓库数据模型的设计,还是一个盲点,探索中。
最近在做大数据技术体系下的数据仓库模型设计,重温数据传统数据仓库的关键技术和数据模型,有感兴趣的可以一起讨论,共同学习。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)