大数据是比较火的一个热词,但说到什么是数据,很多人首先想到的是数字,如1,2,3等。其实这是数据的狭义定义。数据所涉及的范围很广,并且随着技术的发展,数据的定义范围也越来越宽泛,比如在互联网时代文字,图片和视频都是数据,医院里面的医学影像图片也都是数据,甚至包括公司和工厂的设计图案、解决方案等等。
数据是一种客体存在,并随着文明的发展而不断扩大和变化。以前并不是数据的,但现在看来都已经变成了数据内的范畴,比如在互联网出现之前,文字并不被认为是数据,但是互联网出来以后,通过将文字进行电子化储存,因此成了可以计算的文本,这就涉及到自然语言处理技术。甚至包括我们聊天记录、网页内容、打电话记录、用户生存内容(UGC)、论坛评论,购物数据,社会关系,行程记录等等都是数据内容。数据也经历了从结构化到非结构化的转变,而且非结构化数据中蕴含这更大的价值。
由于人们多数据的概念没有那么清晰,容易将数据、信息和知识这三个的理念弄混,特别是数据与信息,真是傻傻分不清楚。虽然数据、信息、知识之间存在这联想,但还是很有必要将三者有个合理的认识,下面就来详细讲讲他们之间的区别与关系。
信息是对世界人和事等描述,它比数据更加抽象。信息是隐藏在数据背后的规律,需要人类的挖掘和探索才能够发现。比如地球的面积和质量,物理学中的参数,圆周率等。
数据是信息的载体,从数据到信息不仅是一门技术,也是一门艺术。以胡夫大金字塔为例,该金字塔的周长和高度的比值为大约6.29,金字塔的长为20埃及古尺长,宽为10埃及古尺长,但高度为11.18埃埃及古尺长。为什么不是一个整数?
通过考古专家的分析,这是为了保证对角线都是整数,分别是15和25。通过对这些数据处理,我们可以得到在古埃及就懂得了勾股定理。
数据和信息处理以后就会得到知识。而知识是数据和信息的更加高级和抽象的概念。知识具有系统性、规律性和可预测性。
数据、信息和知识这三者都是社会生产活动中的一种基础性资源,都可以采用数宇、文宇、符号、图形、声音、影视等多媒体来表示。而且,它们都同时具有客观性、真实性、正确性、价值性、共享性,结构性等特点。
比如我们通过观察可以记录星球的位置和出现的时间等原始数据,再对得到的数据进行分析和挖掘,就能够计算出星球运动的规律,这就是信息,然后对信息进行总结和提炼,就可以得到开普勒三定律,这就是知识。而得到的知识,能够使我们更加清晰的了解世界和生活,还能够通过知识不断改变我们周围的世界。而所有的一切的基础就是数据。
数据、信息和知识是知识工作者对客观事物感知和认识的3个连贯的阶段。
(1)数据的组织阶段。数据是一种将客观事物按照某种测度感知而获取的原始记录,它可以直接来自测量仪器的实时记录,也可以来自人的认识,但是大量的数据多是借助于数据处理系统自动地从数据源进行采集和组织的。数据源是指客观事物发生变化的实时数据。
(2)信息的创造阶段。信息是根据一定的发展阶段及其目的进行定制加工而生产出来的。信息系统就是用于加工、创造信息产品的人机系统。根据对象、目的和加工深度的不同,可以将信息产品分为一次信息、二次信息直至高次信息。
(3)知识的发现阶段。知识是知识工作者运用大脑对获取或积累的信息进行系统化的提炼、研究和分析的结果,知识能够精确地反映事物的本质。
从数据到信息再到知识,3个阶段是螺旋上升的循环周期。人们运用信息系统,对信息和相关的知识进行规律性、本质性和系统性的思维活动,创造新的知识。之后,新的知识又开辟了需要进一步认识的对象领域,然后使人们补充获取新的数据和信息,进人新一轮的上升式循环周期。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)