数据冗余指数据之间的重复,也可以说是同一数据存储在不同数据文件中的现象。可以说增加数据的独立性和减少数据冗余为企业范围信息资源管理和大规模信息系统获得成功的前提条件。
数据冗余会妨碍数据库中数据的完整性(integrality),也会造成存贮空间的浪费。尽可能地降低数据冗余度,是数据库设计的主要目标之一。关系模式的规范化理沦(以下称NF理论)的主要思想之一就是最小冗余原则,即规范化的关系模式在某种意义上应该冗余度最小。
但是,NF理论没有标准的概念可用,按等价原则,在有或没有泛关系假设(universal relation assumption)等不同前提下,冗余的定义可能有好几种。
数据的应用中为了某种目的采取数据冗余方式。
1、重复存储或传输数据以防止数据的丢失。
2、对数据进行冗余性的编码来防止数据的丢失、错误,并提供对错误数据进行反变换得到原始数据的功能。
3、为简化流程所造成额数据冗余。
4、为加快处理过程而将同一数据在不同地点存放。
5、为方便处理而使同一信息在不同地点有不同的表现形式。
6、大量数据的索引,一般在数据库中经常使用。
7、方法类的信息冗余。
8、为了完备性而配备的冗余数据。
9、规则性的冗余。根据法律、制度、规则等约束进行的。
10、为达到其他目的所进行的冗余。
在一个数据集合中重复的数据称为数据冗余。例如在设计数据库时,某一字段属于一个表,但它又同时出现在另一个或多个表,且完全等同于它在其本来所属表的意义表示,那么这个字段就是一个冗余字段。
DEVELOPERS开发
活动
Programs
社区
学堂
大赛
支持
语言
登录
注册
APP
数据冗余和数据不一致的区别丨【绽放吧!数据库】
海拥 2021/08/06 1.2k+
【摘要】 数据冗余和数据不一致是数据库中使用的重要术语。一个好的数据库设计是将数据冗余和数据不一致最小化的设计。在本文中,我们将介绍这两个术语是什么以及它们之间有什么区别。
概述:
数据冗余和数据不一致是数据库中使用的重要术语。一个好的数据库设计是将数据冗余和数据不一致最小化的设计。在本文中,我们将介绍这两个术语是什么以及它们之间有什么区别。
数据冗余:
它被定义为冗余意味着重复数据,也表示数据的相同部分存在于数据库中的多个位置。这种情况称为数据冗余。
数据冗余问题:
在这里,我们将讨论数据冗余的几个问题,如下所示。
1.浪费的存储空间。
2.更困难的数据库更新。
3.会导致数据不一致。
4.数据检索缓慢且效率低下。
示例 –
让我们以板球运动员桌为例。
步骤 1:
如下考虑板球运动员表。
参赛者姓名 队员年龄 队名 团队编号
马龙 32 中国队 1
迪米特里·奥恰洛夫 32 德国队 2
樊振东 24 中国队 1
许昕 31 中国队 1
蒂姆·波尔 40 德国队 2
派翠克·法兰兹卡 29 德国队 2
步骤 2:
我们可以清楚地看到 队名 和 团队ID 在多处重复。我们可以制作一个单独的表来存储这些信息并减少数据冗余。
参赛者姓名 队员年龄 团队编号
马龙 32 1
迪米特里·奥恰洛夫 32 2
樊振东 24 1
许昕 31 1
蒂姆·波尔 40 2
派翠克·法兰兹卡 29 2
步骤 3:
这称为标准化,用于减少数据冗余。
团队编号 队名
1 中国队
2 德国队
数据不一致:
当相同的数据以不同的格式存在于多个表中时。这种情况称为数据不一致。这意味着不同的文件包含有关特定对象或人的不同信息。这可能会导致不可靠和无意义的信息。数据冗余导致数据不一致。
例子
如果我们在很多表中有一个人的地址,当我们只在一个表中更改它而在另一个表中它可能不会更新,因此可能会出现数据不一致的问题。
区别:
话题 数据冗余 数据不一致
状况 适用于数据库中多处存在重复数据的情况。 适用于多个表中存在不同格式重复数据的情况。
如何最小化? 我们可以使用标准化来最小化数据冗余。 我们可以对数据库使用约束来最小化数据不一致。
以上就是本篇文章所要介绍的数据冗余和数据不一致的区别
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)