什么是数据稀疏

什么是数据稀疏,第1张

即含零元素特别多,可以参考“稀疏矩阵”的定义。如果在矩阵中,多数的元素为0,称此矩阵为稀疏矩阵。不一定是零,只要是无用元素,无益于增加数据信息量的元素很多,都可以称其为数据稀疏。

数据库中,稀疏数据是指在二维表中含有大量空值的数据;即稀疏数据是指,在数据集中绝大多数数值缺失或者为零的数据。稀疏数据绝对不是无用数据,只不过是信息不完全,通过适当的手段是可以挖掘出大量有用信息。

稀疏数据是指,数据框中绝大多数数值缺失或者为零的数据。在现代社会中,随着信息的爆炸式增长,数据量也呈现出爆炸式增长,数据形式也越来越多样化。在数据挖掘领域,常常要面对海量的复杂型数据。其中,稀疏数据这一特殊形式的数据正在越来越为人们所注意。

稀疏数据绝对不是无用数据,只不过是信息不完全,通过适当的手段是可以挖掘出大量有用信息的。

No SQL DB是一种和关系型数据库相对应的对象数据库。按照数据模型保存性质将当前NoSQL分为四种:

1.Key-value stores键值存储, 保存keys+BLOBs

2.Table-oriented 面向表, 主要有Google的BigTable和Cassandra.

3.Document-oriented面向文本, 文本是一种类似XML文档,MongoDB 和 CouchDB

4.Graph-oriented 面向图论. 如Neo4J.

关系型数据库的弊端:

关系型数据库的历史已经有30余年了,因此,在某些情况下,关系型数据库的弱点就会暴露出来:

1. “对象-关系 阻抗不匹配”。关系模型和面向对象模型在概念上存在天然的不匹配的地方,比如对象模型当中特有的“继承”,“组合”,“聚合”,“依赖”的概念在关系模型当中是不存在的。

2. “模式演进”。即随着时间的推移,需要对数据库模式进行调整以便适应新的需求,然而,对数据库模式的调整是的成本很高的动作,因此很多设计师在系统设计之初会设计一个兼容性很强的数据库模式,以应对将来可能出现的需求,然而在现在的web系统开发过程中,系统的变更更加频繁,几乎无法预先设计出一种“万能”的数据库模式以满足所有的需求,因此 模式演进的弊端就愈发凸显。

3. 关系型数据库处理 稀疏表时的性能非常差。

4. network­oriented data 很适合处理 人工智能、社交网络中的一些需求。

所以,各种各样的No SQL DB 出现了,这里只简单介绍下Neo4J 的基本知识。

Neo 数据模型

Neo4J 是一个基于图实现的No SQL DB, 其基本的数据类型有如下几种:

Node, Relationship, Property.

Node 对应于图中的 节点,Relationship 对应图中的边,Node 和 Relationship 都可以拥有Property,

Property 的数据结构为。

数据遍历

Neo 提供了Traverser对数据中的数据进行遍历。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6668676.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存