野外PRB数据的检查

野外PRB数据的检查,第1张

对 PRB 路线数据整理完成之后,需要进行数据质量检查。要对每条路线的数据进行逻辑检查、数据完整性检查等,特别要根据野外路线 PRB 数据的编码规则对各类采集数据(地质点、点间界线、分段路线、采样、照片、产状、素描、化石)进行各种编号检查。对路线 PRB 数据应注意检查 P、R、B 过程中各类采集数据的编号,防止因 PRB 编号重复发生文件覆盖而导致的数据丢失、破坏、混乱。检查的结果依 “图层文件、记录号、错误项目”顺序显示在文本窗口中并保存在该路线的目录下 note \ PRBError. TXT 文件。需要纠错时,在图上直接点击错误项目实体标注,在d出的属性格式文件中修改,或打开“属性连动浏览”菜单进行修改和补充内容。

检查的具体方法有两种,分别为 PRB 数据质量程序检查和 PRB 数据质量人工检查。

(1)PRB 数据质量程序检查

选择 “PRB 数据 *** 作”菜单下的 “PRB 数据质量程序检查”功能,系统自动对观察路线(Groute)、地质点(Gpoint)、分段路线(Routing)、地质界线(Boundary)、素描图(Sketch)、产状(Attitude)、照片(Photo)、化石(Fossil)、样品(Sample)、GPS、注释图层(Free)(Free. WT 和 Free. WL)所有 11 个地质采集图层进行路线号、地质点号、样品编号、照片序号、图元类型等数据项的检查。

通过检查可能出现两种错误。第一种是产生无路线号及无地质点号的错误,解决办法是: ①在相应图层中找到不符合要求的点或线,进行修改或删除②进行压缩保存工程 *** 作。第二种是出现对一未命名文件的存取被拒绝,无法对该地质路线的任何内容进行修改和保存的错误,解决办法是: ①修改路线号②在野外手图中新建一路线号,与原路线号相同③把原路线中的内容全部拷贝到新建路线中。

(2)PRB 数据质量人工检查

包括 PRB 数据质量人工检查、PRB 空间分布质量检查(创建多边形检查文件、PB 多边形区域定量评价、PB 空间分布定量评价(矩形))、PRB 多级质量检查记录(PRB 库)。

PRB 数据质量人工检查: 先选择一个要查询的采集图层,并将其设为当前编辑状态。然后 *** 作如下: 选择 “PRB 数据 *** 作”菜单下的 “PRB 数据质量人工检查”功能,选择点、线或面文件,对该图层所有属性进行检查。

PRB 数据空间分布质量评价: 根据区域地质调查技术规范和数字填图野外数据采集指南,区域地质调查与填图的 PRB 数据质量定量评价模型主要从工作量完成情况检查、实际材料图精度检查、地质实体有效控制精度控制指标等来描述。PB 空间分布定量评价则是地质实体有效控制精度的控制指标之一。有两个指标: P 空间分布密度(nP 单位/n平方千米)和 PB 空间分布密度(nPB 单位/n 平方千米)。P 空间分布密度(nP 单位/n平方千米): 程序自动利用 GIS 空间分析功能,统计图幅内每 n 平方千米(由规范或技术要求确定)含地质点的个数。该指标可以找出没有路线控制的最大区域范围,以便评价填图必要的精度数字指标。允许不同区域给定不同控制指标。该指标不仅属工作量统计指标,同时也属精度控制指标。PB 空间分布密度(nPB 单位/n 平方千米): 程序自动利用GIS 空间分析功能,统计图幅内每 n 平方千米(由规范或技术要求确定)含地质点和点间地质界线的个数。在 PRB 数字填图中,点间地质界线(B)也具有地质点控制精度的效力。该指标可以找出没有路线控制的最大区域范围,以便评价填图必要的精度数字指标。允许不同区域给定不同控制指标。该指标不仅属工作量统计指标,同时也属精度控制指标。

PRB 多级质量检查: 以图幅中野外路线为单位,进行质量检查。选择检查的路线、检查方式,检查方式包括自检、互检、项目组检查、主管部门检查等方式。填写检查者、记录者、检查结果和备注,然后保存检查文件。检查文件存放在 “图幅 PRB 库 \ Note \Check. WB” 文件中。每条路线有与 4 种检查方式分别对应的 1 条检查记录。右边的编辑框是区域地质调查与填图的 PRB 数据质量定量评价内容,由计算机计算得出。需要说明的是本 *** 作是对图幅 PRB 库进行的。

提高数据质量的步骤和措施

由于大多数系统和应用程序会持续不断接收到新数据,数据量也在不断增加,因此确保数据质量并不是一次就能完成的。所有企业都应该使用一种反复进行的阶段性过程来管理数据质量,此过程包括数据质量评估、规划以及策略的选择和实施。

第一步对数据质量进行评估。评估当前的数据质量状态是第一步。对数据质量进行评估能帮助企业准确地了解数据的内容、质量和结构。主管人员参与数据质量评估以及分析在数据检查过程中发现的问题对于数据质量评估来说都很重要。在最有效的数据质量评估中,所有问题都将按照对业务影响从大到小的顺序列出,这将帮助IT机构节省项目成本。

第二步,制订数据质量计划。彻底了解企业数据的内容和质量后,接下来的步骤是制订一个计划,来修改当前的错误并避免未来错误的发生。有效的计划不但可以提高企业当前所有应用程序中数据的质量,还将制定一些方式以确保新应用程序从一开始就遵循数据质量规则。

第三步,选择和实施数据质量策略。选择改善企业数据质量的策略,要求决策者权衡每个数据质量计划的成本以及该策略产生的影响。目前的策略类型有两种: 在企业输入数据时提高数据质量的方法称为“上游”方法,而从运营系统提取数据的应用程序(如数据仓库)中改善数据质量的方法是“下游”方法。

上游策略研究当前应用程序的逻辑、数据和流程,解决检查过程中发现的异常情况。此策略可能涉及到更改应用程序逻辑、添加更好的表验证、改善与数据输入相关的流程,它致力于企业数据的高准确性。另外,此策略还要求使用应用程序本身附带的数据质量功能。

下游策略解决目标应用程序或数据仓库(而非数据源)中的数据质量问题。由于数据可以根据需要随时进行修改,所以企业能够在流程(尤其是数据转换、名称和地址清洗以及查找验证)中改善数据质量。下游策略仅为目标应用程序或数据仓库改善数据质量,但与上游策略相比,它的实施过程更简单,成本更低。

1. 建立数据的标准,明确数据的定义。

通常,独立的应用系统会有一个比较模糊的、有时也会有比较清晰的数据标准和数据定义。为了保证系统的正常运行,这些系统的用户必须在数据的标准和数据的定义上达成一致。不过,这些标准和定义大多数时候与企业中其他系统中的数据标准和定义并不一致。因此,需要从整个企业的角度出发,建立统一的数据标准和数据定义,同时,整个企业必须就这个数据标准和数据定义达成共识。这一句话说起来容易做起来难。因为人通常本能地会拒绝改变,改变数据标准和定义并不是轻而易举的。为此,强烈建立在企业中除了设立一个高管级别的数据质量管理委员会外,还需要选定一个执行能力强的项目负责人,需要他推动相关人员接受新的数据标准和定义。

在具体建立新的数据标准和数据定义时,需要仔细权衡,哪些定义和标准是出于企业内部的原因(比如出于方便、习惯等)制订的,哪些定义和标准是因为要有效反映外部的真实世界而制订的。相对而言,前者更容易执行一些。

2. 建立一个可重复的数据收集、数据修改和数据维护流程。

数据管理面临的两个主要挑战是企业本身的复杂性和身份信息不断变化。这两个客观原因的存在意味着企业的数据质量保证行动永远没有结束之日,因此,企业在制订数据质量的保证措施和数据质量指标时,必须保证这些措施和指标能够不断重复。

3. 在数据转化流程中设立多个性能监控点。

数据的质量高低可以根据最终用户的需求来评价,也可以通过与同类数据源的比较来评价,还可以通过与前一阶段的数据质量进行比较来评价。但在制订数据质量的战略时,比较理想的办法还是根据最终用户的需求来进行。不过这里存在一个问题是,等到最终用户拿到数据时再针对数据的问题进行修正已经太迟了。一个有效的数据质量保证办法是在每当数据发生转换后就与前一时期进行比较,从而对数据质量进行评估。如果此前所采用的数据质量改进方法有助于提高最终用户的满意度,那么,这些中间指标的达标也预示着项目的最终成功。

4. 对流程不断进行改善和优化。

我们常常听到有人说,他们制订了很多办法来迅速而且大幅度提升数据的质量,但很少听说最后他们能真正得到满意的结果。其原因就在于数据的'质量改进绝非一朝一夕的事情,而是一个持续的过程。正确的办法是通过一个不断改进的流程,持续不断地排除错误、对数据进行整合和标准化,最后达到流程的自动化,从而降低数据质量保证计划的总体开销。实际上,排除错误、数据整合和数据标准化从来就不是一件容易的事情。数据质量管理计划的负责人将配合公司高管组成的数据质量管理委员会来保证这个流程的顺利执行。要注意的是,作为该项目的负责人,不能墨守成规,仅仅因为自己以前一向采用某种方法,就要求别人也必须采用这一方法,特别是当发现这些方法成本高昂的时候,就应该考虑换一种方式了。

5. 把责任落实到人。

通常,我们认为那些与数据的产生、维护相关的人员是负责任的,但是,很有可能,他们有很多其他的工作要做,因此作为数据质量的负责人光有善良的想法是难以提高数据的质量,很有可能一辈子也达不到目标。对于那些负责数据的产生、数据的合理化以及对数据进行清理和维护的人,应该给他们的活动制订明确的指标,这样他们才能真正理解人们到底希望他们达到什么目标。更重要的,他们还需要针对这些指标细化对他们自己的要求,当然,他们会因为达到或者超过这些指标而得到奖励。其中,一个执行力强的负责人的价值体现出来,他会针对具体情况适时调整数据质量的目标。

最后,再次强调考虑与数据管理和数据质量的改进项目有关的人的因素,他们的行为是非常重要的。从某种程度上说,要比具体选择什么软件要重要得多。上述5点有助于帮助组织规范数据质量管理中与人有关的流程。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/11469748.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-16
下一篇 2023-05-16

发表评论

登录后才能评论

评论列表(0条)

保存