大数据里的基础库、主题库、专题库有什么区别,各自呈现方式是什么,比如政务行业?

大数据里的基础库、主题库、专题库有什么区别,各自呈现方式是什么,比如政务行业?,第1张

基础库一般是指业务中原有的如常口,企业登记等

主题库是指把针对某一主题的相关类别的表集成到一起,如出行。

专题库一般是某领域内的某特定时期的专项业务,所形成的表,如xxx事件,xx活动

表现形式上以sql库为主。

主题数据的基本特征有:

1.面向业务主题。主题数据库是面向业务主题的数据组织存储,例如,企业中需要建立的典型的主题数据库有:产品、客户、零部件、供应商、订货、员工、文件资料、工程规范等。其中产品、客户、零部件等数据库的结构,是对有关单证、报表的数据项进行分析整理而设计的,不是按单证、报表的原样建立的。这些主题数据库与企业管理中要解决的主要问题相关联,而不是与通常的计算机应用项目相关联。

2.信息共享。主题数据库是对各个应用系统“自建自用”的数据库的彻底否定,强调建立各个应用系统“共建共用”的共享数据库。不同的应用系统的计算机程序调用这些主题数据库,例如,库存管理调用产品、零部件、订货数据库;采购调用零部件、供应商、工程规范数据库等。

3.一次一处输入系统。主题数据库要求调研分析企业各经营管理层次上的数据源,强调数据的就地采集,就地处理、使用和存储,以及必要的传输、汇总和集中存储。同一数据必须一次、一处进入系统,保证其准确性、及时性和完整性,经由网络-计算机-数据库系统,可以多次、多处使用。

4.由基本表组成。一个主题数据库的科学的数据结构,是由多个达到“基本表” (Base Table)规范的数据实体构成的,这些基本表具有如下的特性:

· 原子性——基本表中的数据项是数据元素(即最小的、不能再分解的信息单元);

· 演绎性——可由基本表中的数据生成全部输出数据(即这些基本表是精练的,经过计算处理可以产生全部企业管理所需要的数据);

· 规范性——基本表中数据满足三范式(3-NF)要求,这是科学的、能满足演绎性要求、并能保证快捷存取的数据结构。

数据库与数据仓库的区别实际讲的是 OLTP 与 OLAP 的区别。

*** 作型处理,叫联机事务处理 OLTP(On-Line Transaction Processing,),也可以称面向交易的处理系统,它是针对具体业务在数据库联机的日常 *** 作,通常对少数记录进行查询、修改。用户较为关心 *** 作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于 *** 作型处理,像Mysql,Oracle等关系型数据库一般属于OLTP。

分析型处理,叫联机分析处理 OLAP(On-Line Analytical Processing)一般针对某些主题的历史数据进行分析,支持管理决策。

首先要明白,数据仓库的出现,并不是要取代数据库。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储业务数据,数据仓库存储的一般是历史数据。

数据库设计是尽量避免冗余,一般针对某一业务应用进行设计,比如一张简单的User表,记录用户名、密码等简单数据即可,符合业务应用,但是不符合分析。数据仓库在设计是有意引入冗余,依照分析需求,分析维度、分析指标进行设计。

数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。

关于派可数据,用心创造数据价值 让数据分析更简单


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9537729.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-29
下一篇 2023-04-29

发表评论

登录后才能评论

评论列表(0条)

保存