20世纪90年代主要的数据来源

20世纪90年代主要的数据来源,第1张

农产品行业不仅包括农产品农产品加工业、农产品批发市场行业、农产品冷链物流行业、农产品进出口贸易,还涉及到农产品行业协会、农产品电商业、农产品期货市场等方面,产业体量庞大、一应俱全。

中国农产品行业的发展历程大致分为3个阶段

改革开放为各行各业带去了发展的希望,其中也包括农产品行业。按时间线梳理,农产品行业发展大致可划分为3个阶段:上世纪80年代中期至90年代中期为第一阶段,是探索阶段;90年代中期至90年代末期为第二阶段,是成长阶段;进入新世纪以来为第三阶段,是创新阶段。

改革开放以来至90年代中期,农产品数量、质量提升,农产品批发市场起步发展,第一批和第二批流通领域的农产品行业协会诞生

中国农产品行业在此期间取得了非常瞩目的成就,农产品不论是从数量上还是从质量上都实现了巨大的飞跃,基本满足了当时人们的生活需要,农产品产业发展出现专业化趋势。20世纪80年代初期,农产品批发市场从农贸、集贸市场起步发展;第一批农产品行业协会诞生,用于形成全国性的食品行业管理网络。

80年代中期以后,中国进一步改革了农产品统购统销体制,到1991年,已有70%以上的农副产品的价格实行市场调节,国家定价的农产品由1978年的113种,下降到1985的38种,直至1991年的9种。1992年,“双轨制”被打破,中国初步建立起以市场为主形成价格的农产品流通体制。到1993年,在社会农副产品收购总额中,国家直接定价的农副产品不足10%,其余均实现了市场定价或以市场供应为基础的价格。基于上述农产品行业的行业转变,一批流通领域的农产品行业协会应运而生。

数据库是计算机应用系统中的一种专门管理数据资源的系统。

数据有多种形式,如文字、数码、符号、图形、图像以及志声音等。数据是所有计算机系统所要处理的对象。人们所熟知的一种处理办法是制作文件,即将处理过程编成程序文件,将所涉及的数据按程序要求组织成数据文件,用程序文件来调用。数据文件与程序文件保持着一定的对应关系。在计算机应用迅速发展的情况下,这种文件式方法便显出不足。比如,它使得数据通用性差,不便于移植,在不同文件中存储大量重复信息,浪费存储空间,而且更新不便。数据库系统便能解决上述问题。数据库系统不从具体的应用程序出发,而是立足于数据本身的管理,它将所有数据保存在数据库中,进行科学的组织,并借助于数据库管理系统,以它为中介,与各种应用程序或应用系统接口,使之能方便地使用数据库中的数据。就好像医院中的药房一样,面向所有科室,不论哪个科开的药都可到药房去拿药,药品的进出、更新、保存均由药房来做。有了数据库系统,所有应用程序都可以通过访问数据库的办法来使用所需的数据,实现了数据资源的共享。数据库管理系统负责各种数据的维护、管理工作,如大批数据的更新、保存、交流等也很方便,数据的查询、检索等 *** 作也变得十分容易。

一个数据库系统通常由三部分组成:

(1)数据库(DB) 是按照某种规范格式存放在一起的相关数据的集合。简言之,数据库是集中存放的大批数据文件。

(2)数据库管理系统(DBMS) 是 *** 纵和管理数据库的大型软件,是用户的个别应用与整个数据库之间的接口。当用户向数据据库发出访问请示后,DBMS接受,分析该用户的请求,并根据用户请求去 *** 纵(查询、存储、更新)数据库中的有关数据。

(3)用户应用 指用户根据自身的需要,利用DBMS提供的相关命令编制的一组实用程序。例如在一个饭店管理的数据库系统中,可能会存在着多个用户应用,包括预订房间、客登记、订购机票等。

90年代以来,不同的应用领域对数据库的需求使数据库技术向非传统应用方面发展,产生了新的智能数据库、知识数据库、图像数据库、面向对象数据库和可扩充数据库等。

20世纪90年代,随着数据库系统的广泛应用和网络技术的高速发展,数据库技术也进入一个全新的阶段,即从过去仅管理一些简单数据发展到管理由各种计算机所产生的图形、图像、音频、视频、电子档案、Web页面等多种类型的复杂数据,并且数据量也越来越大。

数据库在给我们提供丰富信息的同时,也体现出明显的海量信息特征。信息爆炸时代,海量信息给人们带来许多负面影响,最主要的就是有效信息难以提炼,过多无用的信息必然会产生信息距离(信息状态转移距离)是对一个事物信息状态转移所遇到障碍的测度,简称DIST或DIT)和有用知识的丢失。

这也就是约翰·内斯伯特( John Nalsbert)称为的“信息丰富而知识贫乏”窘境。因此,人们迫切希望能对海量数据进行深入分析,发现并提取隐藏在其中的信息,以更好地利用这些数据。

但仅以数据库系统的录入、查询、统计等功能,无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势,更缺乏挖掘数据背后隐藏知识的手段。正是在这样的条件下,数据挖掘技术应运而生。

扩展资料

数据挖掘过程模型步骤主要包括定义问题、建立数据挖掘库、分析数据、准备数据、建立模型、评价模型和实施。下面让我们来具体看一下每个步骤的具体内容:

(1)定义问题。在开始知识发现之前最先的也是最重要的要求就是了解数据和业务问题。必须要对目标有一个清晰明确的定义,即决定到底想干什么。

比如,想提高电子信箱的利用率时,想做的可能是“提高用户使用率”,也可能是“提高一次用户使用的价值”,要解决这两个问题而建立的模型几乎是完全不同的,必须做出决定。

(2)建立数据挖掘库。建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。

(3)分析数据。分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和累人的事情,这时需要选择一个具有好的界面和功能强大的工具软件来协助你完成这些事情。

(4)准备数据。这是建立模型之前的最后一步数据准备工作。可以把此步骤分为四个部分:选择变量,选择记录,创建新变量,转换变量。

(5)建立模型。建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型对面对的商业问题最有用。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。

有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分,一个用于模型训练,另一个用于模型测试。

(6)评价模型。模型建立好之后,必须评价得到的结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关费用的多少。

经验证明,有效的模型并不一定是正确的模型。造成这一点的直接原因就是模型建立中隐含的各种假定,因此,直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意之后再向大范围推广。

(7)实施。模型建立并经验证之后,可以有两种主要的使用方法。第一种是提供给分析人员做参考;另一种是把此模型应用到不同的数据集上。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6696069.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-26
下一篇 2023-03-26

发表评论

登录后才能评论

评论列表(0条)

保存