数据库原始数据构建

数据库原始数据构建,第1张

综合地质数据库原始数据是建立专题数据库的直接原始数据,是纸介质资料和电子资 料目录、数字化、编码数字化等全部数据的归档汇总,原始数据按照地质矿产资料分类组 织,可直接通过数据库系统工具导入综合地质数据库。

综合地质数据库原始数据的构建方法:

(1)建立原始数据分类目录;

(2)扫描影像文件、PDF文件、编码数字化电子表格、电子文档(Word文档等)、 矢量化图件、电子文件包(压缩包)归档存入相应的原始数据目录;

(3)以资料单位(报告等)为基本单位,从地质矿产资料分类电子文档提取该资料 单位的资料列表,建立基本单位对应的Access单一数据库(MDB库文件),存储属于该资 料单位的文档、表格、图件列表及其数据;

(4)设计电子表格对应关系表格的数据字典,用工具或编写程序将电子表格转换为 关系表格,存入相应的 Access 单一数据库。

图2.5 综合地质数据的E-R图

原始数据可分为计数资料和计量资料,两者的整理上有所不同.

1.计数资料的整理:采用单项分组法进行整理,它的特点是用样本变量自然值进行分组,每组均用一个或几个变量值来表示.分组时,可将数据资料中每个变量分别归入相应的组内,然后制成次数分布表.

2.计量资料的整理:一般采用组距式分组法.分组时需要先确定全距、组数、组距、各组的上下限,然后按观测值的大小来归组.具体步骤如下:

(1)求全距: 最大值-最小值

(2)确定组数和组距:根据样本容量的大小确定组数,样本容量30--60的,一般设置5--8组,样本容量增加,组数也相应增加.确定了组数后,可以计算出组距:组距=全距/组数.

(3)确定组限和组中值:应该注意的是最小一组的下限要小于资料中的最小值,最大一组的上限,要大于资料中的最大值.而组中值=(下限+上限)/2,

(4)分组,编制次数分布表.

具体分组实例可以在EXCEL或SAS等软件中完成.


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/6708055.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-03-27
下一篇 2023-03-27

发表评论

登录后才能评论

评论列表(0条)

保存