分别是:
1、数据规模、2、数据类型、3.模式(Schema)和数据的关系、4.处理对象
5、获取方式、6、传输方式、7、数据存储方面、8、价值的不可估量
价值的不可估量:
传统数据的价值体现在信息传递与表征,是对现象的描述与反馈,让人通过数据去了解数据。
而大数据是对现象发生过程的全记录,通过数据不仅能够了解对象,还能分析对象,掌握对象运作的规律,挖掘对象内部的结构与特点,甚至能了解对象自己都不知道的信息。
这个怎么说呢?数据库应该是大数据的课程之一,但是应该不算是主要课程。因为大数据有5V特性,那么大数据课程也应该集中于这五个方面。
第一个V(Volume(大量)),那么就会有数据治理与数据整理,从大量甚至海量的数据中,找到有价值的数据,或者说有关联的对分析有帮助的数据。
第二个V(Velocity(高速)),这部分主要是数据实时性,比如现在有时某些城市会有所谓的堵车报告,或者实时概况,这种就是高速提高的实时性。比如今天才得到去年的信息,那有什么用?
第三个V(Variety(多样)),大数据并不是特定收集某些相关数据,而是从第一个V大量的数据中找到很多信息,信息非常的多,这里主要的内容应该是数据分析,以及数据关联性等等
第四个V(Value(低价值密度)),每一条数据拿出来其实都是没神勇的,只有将数据放在一起,进行分析管理才能得到一些趋势,概率,密度等等这些内容,其实大数据要做的就是讲得到的低价值密度的信息进行提炼,提炼为价值密度更高的信息。
第五个V(Veracity(真实性)),这个其实就是一个数据治理的过程,只是这里更多的存在一些去伪存真的意思,就好比现在的“刷X”,如果能判断出来哪些是刷的,哪些是真的,那么这不就是数据治理吗。而且只有真实的有效的信息才能对大数据有用,虚假的信息指挥干扰分析结果,所以真实性也很重要。
那为什么数据库还是大数据的课程之一?上面五个V和数据库没关系啊,但是大数据的数据最后还是要分层次,分系统的展现给用户,这里还是需要数据库来做,所以数据库还是有作用的,而且不管现在用的是什么大数据分析工具和怎么做的数据分析,分析工具都是作用在数据库内的数据上(这里的数据库并不特指都一个产品,而是所有的数据库产品),所以数据库本身还是要学习的,只是与在大数据中,数据库并不是那么重要而已。
举例来说:你可以不懂数据库,但是你可以涉及算法,算法就是大数据的主要核心之一,然后再由动数据库的将算法转换成数据库语言,只是这样的人一般都是大牛,平常人能做到转换这一步就不错了。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)