脉策预测感染是怎么统计的数据

脉策预测感染是怎么统计的数据,第1张

脉策预测感染是怎么统计的数据

本文数据来自脉策科技城市数据库,数据使用百度搜索指数、巨量算数数据计算(2022/12/16更新)

名词解释

“达峰进度条”:是指疫情达峰前已经感染的人口除以疫情达峰时可能会感染人口的比例。这是城市疫情逐渐加剧,院感增加的一段日子,数字达到100时日增感染者就达到了顶峰(达峰100%并不意味着感染人数占城市总人数的比值达到了100%)。

“结束进度条”:是指疫情达峰后到疫情结束前已经感染的人口除以这段时间内可能会感染人口的比例。说明的是在疫情过峰后,在这一波疫情结束前已经感染了多少人,这段时间的疫情虽然整体缓解,但感染还是会继续增加。在数字达到100时,城市的这一波疫情就基本结束了。

注意:以上两个指标均为大数据预测指标,而非真实病例统计指标;转载、引用请注明数据来源。

预测方法

本次预测使用了多个平台的症状关键词搜索数据,总体来说,是看超额搜索指数的覆盖面积,当覆盖面积达到一定阈值后就代表人口感染达到一定闯值,感染自然达峰、结束。

可以。城市数据库感染预测数据支付宝可以查看,新闻也能看到,支付宝的数据获取难度相对大。城市数据库囊括了全国314个城市,含省会城市、自治区和地级市城市的社会经济发展和城市建设统计数据。

本文译自Environmental Geology,2002(41)∶765~775。

Alberto Pistocchi1Lucia Luzi2Paola Napolitano3著

朱汝烈4译校

(1Studio di Ingegneria per I'Ambiente e il Territorio,Viale GCarducci,15,47023 Cesena,Italy;2IRRS-CNR,MiLan,Italy;3ACTA Studio Associato,Naples,Italy;4中国地质调查局水文地质工程地质技术方法研究所,河北保定,071051)

摘要此案例研究,源于将不同概率的预测模型[贝叶斯(Bayesian)概率、模糊逻辑、“与”、“或”、“总和”、“产出”、“灰度(非线性)”运算以及必然性因素等],用于编制意大利亚平宁山脉北部的丘陵和山岳地区滑坡灾害地图。利用7个数据层来检验非常脆弱的区域:岩性、与地质构造线的距离、年降雨量数值、土地覆盖类型、地形坡度和坡向,以及与水文网络段的距离。与用预测率指数预测的不同结果进行了对比和缜密的讨论,以评价这种易于运用、适宜有效的数据库在土地规划中使用价值的可能性。

关键词支持性函数 整体化模拟 滑坡灾害 空间数据库

1 导言及一般论点

近几年来,全欧洲各地方及规划部门在建立空间数据库方面有了长足进展。然而,很多数据库似乎对决策支持仍然不起作用,而且其使用的有效数据经常是纯粹土化的。特别是,最终数据使用者和决策者对于有关地理信息系统(Geographic Information Systems——GIS)的模拟能力,近乎于毫不知晓的状况。极少有地方政府机构在日常的决策中采用预测模型作为其有效支撑。

地理信息系统为详细的空间特征模拟带来巨大的能力,并且许多地方政府现在已拥有GIS技术,为其使用提供了方便条件。人们在对自然界现象进行日常习惯性观察时,这一重要信息有变成一种更有力的方法手段的潜在可能吗?

出于参与规划和目标共享的需要,地学家已经注意到确定的共享资源在用于规划和决策支持中做出的评估具有何等重要性的有关阐述。一些人强调地球科学地图在制定政策和土地使用规划过程中的作用。据他们的观点,灾害地图(hazard maps)的主要作用是,为决策者提供有关土地开发规章条例定义问题的正确观点。

基于自然现象之间因果关系的预测模型,已被水文工作者、地球科学家、环境分析家和工程师广泛地应用于自然风险评估、自然资源管理、污染防治与土壤改良及环境影响评估等领域。然而,就诸如滑坡这一自然灾害场合而言,要建立一个能在区域规模内可靠适用的模式似乎相当困难。一些人探究产生这一困难的原因,认为主要是受模型和数据的限制。与其他风险管理的角度不同,很少有管理者探索过有关定量模型的应用问题。

滑坡灾害制图的传统方法,依赖地质学家和地貌学家的经验观察、鉴定(通过对现场特性的直接观察和远距离的检测报告)来解释滑坡发生的特征。这样虽有相当可能判明既往事件,但是在撇开专家主观性及定性判断的情况下,几乎不能支持任何预测。

近几年来,已经提出了基于成带现象的大地构造模型。然而,基于大地构造模型的计算方法,或者说实际上是基于指数叠加的方法,限于数据不足或数据质量的低下,尽管其自然基础相当稳固,仍经常是不可靠的。

另一方面,通过“客观”的可复制模型进行的预测,分析家对可能的、有限的随机选择感到兴趣。特别是下列这些情况:

·当具有相当重要性的规划设想涉及到社会冲突时;

·当现象不容易觉察时;

·当对覆盖整个所关心区域的现象做详细测图所耗费用过于高昂,因而有必要对那些需更深一步了解的区域进行“筛选范围”模拟的时候。

一般说来,模拟过程与决策很相似,而且其工作具协调性和基础性。灾害地图之所以合理的一个理由,是通过专家的专门鉴别,可用模拟方法学的手段再现、复制,可以有助于认识的社会构成,亦即在管理者、社区公众以及科学家之间分享正确的决策准则。

这一原因导致开展使用概率进行预测的可能性的调查研究。在这些探索过程中,充分运用有关滑坡事件的先验性知识,通过合理地确定参数,用模糊的、或随机的地图套叠方法进行概率预测。

在最近几年,对这种方法做了很多探索。所有这些方法已经比较广泛地使用于敏感性分析或不同方法的性能对相同案例的研究。目前,在这些应用中存在的主要困难是不同的地图的对比。

有人提出了一种解决问题的构想,以完善绘图功能。在那些作者们的工作中,显示了概率、模糊的范畴,并可用现象发生地区最支持性的探测功能——例如滑坡或者矿藏——来证明。这些技术通过推测、校核而发挥效用;对其他诸如神经和贝叶斯(Bayesian)网络等方法,其共通特征与一般的数学模拟近似。以这种方法能轻易地找出一种称之为预测比率的独特标准,它主要用于比较不同预测地图,堪称使模型具有良好性能的有效措施。对其解释如下:支持性函数的用途在于以产生至少包含科学家基于规章的判断,即可从现场经验获得的、预测大部分正确的地图为目标。当然,随后由于专家对现象认识和理解的逐步深化在评估期间必然要求选择多种模拟。同时,由于协调不当而产生变量的假定概率,以及数据缺乏和不可靠,也可引起谬误的结果。不过,运用定量法可以使模型的校准和确认能够支持预测的透明度和合理性。支持性函数模拟方法最近已在专门为其安排的某些案例研究中应用。

本文目的在于,探讨支持性函数模拟对用现有的数据库标准认定的滑坡事件,编制灾害地图的可应用性,并且检查这种方法在现有的数据库里信息的运用中如何改进,以与其他技术(例如,每个岩性单位的滑坡频率编图或者纯粹的滑坡目录清单似的绘图)相比较。

支持性函数模拟也可用于构建数据库的概念性设置:数据的收集严格依赖于在理论框架上对最佳可用信息的准确理解。

2 理论背景

很多作者指出,数值技术的使用与那些对相关现象自身属性的局部价值认为值得关注的事件相联系。属性被认为是事件的证据因素,“或然性”、“可能性”或者发现事件的“可能”程度,在一定意义上与每个相关属性的存在非常符合。假定 A是已进行分析的定义域,而 F是被检查的事件现象。若 r数据层为有效数据,则对于每一个属性种类中的mk来说,设定k=1,…r,便可对每个数据层定义一个分配函数:

地质灾害调查与监测技术方法论文集

它将 A的每个象素分配到k层序列中的一层中;可以为每层确定另一个函数:

地质灾害调查与监测技术方法论文集

在这种情况下,地图在每个层里出现一个数值下降的间隔[a,b]。在此,a和b取决于分析者(如稍后将指出的那样)所做的进一步假定。这个数值代表支持性(favorability),即假定一旦遭遇某种特殊种类属性现象出现时的可靠程度。

对作为每个数据层的函数成分 V和R被定义后,支持性函数可表示为:

地质灾害调查与监测技术方法论文集

间隔极值 a,b必须由分析家据其“可靠性”的解释而定,若认为可靠性与“可能性”相同,则 a=0,b=1。若令可靠性范围等于确定性系数,则 a=-1,b=1。如果选择不同的方法,则可能需要另外的数值。

支持性函数在本项目中的不同用法将在本报告中予以陈述。

若支持性假设为与特定现象 F相关,设定与事件的可能性一致的属性种类为E1,…,E。,然后根据贝斯定理,按 E1,…,E。独立条件假说,可写为:

地质灾害调查与监测技术方法论文集

在ppsI中,I=1,…,n,是发生必然属性种类的优先概率,并且可用该属性种类存在的总面积的百分比进行估算。pps1至n作为属性种类的先期共同可能性考虑;这可以作为全部种类共同发生的总面积的百分比。ppaI,I=1,…,n是观察到的F对于属性种类Ei事件的可能性;这可以根据公式计算。ppaI=1-(1-(areaI)-1)nb(I),其中areaI是符合i系列条件的面积,而nb(i)是与F条件也符合的i系列的面积。psF是所有覆盖整个区域的F的优先概率,并可用所有符合F条件面积的百分数算出。

按此法则,一张地图可以由发生的属性种类的每种组合的计算编制出。这可以通过常规交叉作业程序,在GIS的栅格内 *** 作完成。

如果使用确定性系数,则运算法则作如下相应变动:

(1)一种属性种类的确定性系数可以定义为:

地质灾害调查与监测技术方法论文集

式中:I=1,…,n;n是作为原因因数的主题数据种类的数量。

(2)对两个数据种类来说,确定性系数根据下列法则计算:

当 CF1和CF2均为正号,那么 CF1+2=CF1+CF2-(CF1×CF2);

若 CF1和CF2符号相反,则 CF1+2=CF1+CF2/{1-min(|CF1|,|CF2|));

若 CF1和CF2均为负号,则 CF1+2=CF1+CF2+(CF1×CF2)。

(3)程序通过首先计算 CF1+2=CF12,然后 CF13=CF12+3等等,按此重复 *** 作可获得更多的图件。

作为最后的方法,采用模糊集合论通过计算“模糊总和”、“模糊产出”,“模糊与”、“模糊或”以及“模糊非线性函数”。所有这些函数都是在假设 F存在的可能性预测值等于给定的种类EI(即 ppaI)的条件下进行运算的。它们是:

·“模糊与”=min(ppaI),I=1,…n;

·“模糊或”=max(ppaI),I=1,…n;

·“模糊结果”=Ⅱ(ppaI),I=1,…n;

·“模糊总和”=1-Ⅱ(1-ppaI),I=1,…n;

·“模糊非线性计算”=(模糊总和)(模糊结果)1-γ,γ是0:1范围的参数。

按此方法,可确定编制覆盖层地图的法则,以便分析家能评价覆盖整个研究地区的不同事件属性数据差别,并有助于进一步识别存在更多现象的场地。这些计算结果代表与被认为属于有利性的现象相关指标的数目。必须注意到,除已描述之外,根据相应的资料证据分量、可信功能、线性回归覆盖概率以及其他诸多条件,可采用不同的技术。

必须指出,优先概率psF需要对确定性系数的估计测定而计算获得,但将它用于绝对边界条件是无意义的,因为要预知未来的滑坡事件的可能性实际上几乎是不可能的。预测根据的理由必须在概括全部条件求得支持性指标后,方可确认,而不能以对灾害的数字计算结果为依据。

3 应用

用于本案例研究的地区在意大利(图1)北部的萨维(Savio)河流域。区域地质概况基本上为泥灰岩和沙岩组成的一个沉积盆地。可更详细分为以下3种主要的地质岩层:

图1 研究区位置图

(1)托尔顿阶(Tortonian N1)为灰色砂质和泥质浊流沉积岩,是主要地质岩层,并出露于这条主要溪流两侧。

(2)由微晶质石膏与泥质粘土和沙层互层组成,而其基底为含硫石灰岩地层。

(3)由泥质岩、砂质岩和砾岩3层构成,全部含有灰岩层。

此外,还有淤泥质泥灰岩层、晚始新世砂岩地层、上新世粘土以及混杂堆积的粘土层出露地表。

该地区被大量滑坡覆盖,在不同的地质单元内,大多数情况下是以滑移型或泥石流型的运动形式发生。而且,有的地区有岩石崩落,并存在块体平移运动,然而对它们均未做过分析。研究过程中使用的数据由埃米利亚·罗马格纳地区地质调查所(Regione Emilia Romagna Geological Survey)提供。

用于本案例研究的数据库由若干主题层构成,它们涉及:

·线性构造(断层,向斜和背斜),比例尺1:50000;

·岩性单元,比例尺1:50000;

·根据CORINE欧洲工程指南协议,从TM陆地卫星映像获得的土地覆盖情况,比例尺1∶50000:

·数字地形模型(DTM),根据从Regione Emilia Romagna地方当局的地图数据库中获得的、通过计曲等高线内插、等高距为50m的等值线制成;

·整个地区的7个降雨计量站的降雨测量数据;

·数字化水文网,比例尺1:10000。

必须强调,数据库的分辨度非常低劣,另外,数据在比例尺上很不均匀。有人会认为特别是当与平均滑坡面积进行对比时,地形信息明显很不精确,因而成为非实际滑动的运动学的代表。这项研究的目的是评价现实世界数据库的预测能力(前已阐述),必须意识到,重要的不是做出可靠的灾害地图,因为最好的信息虽已被应用殆尽,但不可能有任何更深远范围的调查和数据可供获取。正如在以下内容所强调的那样,与土地计划的预测相比较,评估的结果将为数据库的改进给予更多的输入内容。

从DTM数字地形模型中形成了坡度和坡向地图,并用固定的数值间隔对坡度做了分级。

对线性构造的距离做了计算,目的在于评价构造干扰对坡体稳定性的可能影响。以对栅格地图和栅格化作为计算结果。

分析了降雨资料,以查明高程与年降雨量之间的关系。从这两个变量的一个回归方程发现:y=07086x+70819(R2=066),x为海拔高程(m),y是超过30年的长时间级数降雨量的总平均值(mm/a)。后来用该方程式做了一幅连续降雨地图,结果明确显示,DTM既像降雨特征的指示剂,同时也犹如位能释放的一个显示器。

应当注意,过高的高程与降雨的相互关系相当微弱,而更进一步的分析则要求更好地描述该地区的实际降雨分布情况。然而,依据现有数据,仅能说明已经适当地查明了降雨分布的一般趋势而已。

尽管概念上的差异特性可以在滑坡的现象情况与所需的因素之间梳理出来,然而,当其他所需要特征都存在的情况下,恰恰只是“要素”触发了滑坡。可以认为,所有这些数据层都可能具有优先意义。

至于存在滑坡可能性的数据,只能依赖地方当局的土地不稳定情况报表获得。应着重指出,数据库适用于构建GIS的长时间序列分析。而且,其数据的密度和分布,按统计学来看,属具典型意义的现实滑坡分布。可以证明,事实上,当为贝叶斯程序培养的数据集不是足够大(并且排列也不足够随机)——这关系到对分区性随机变量的获得——的时候,按定量评价的观点衡量概率综合模拟,是毫无意义的。本案例中,滑坡发生的优先总和有利性条件(级别—特殊)的概率ppa1和psf,需由专家们判定。而且,选择滑坡的类型和年龄以便培养数据系列是重要的,这样的系列可照顾到同类滑坡。已有人进行了关于“泥石流”和“崩滑泥石流”类型滑坡的分析,认为通常发生在局部地区。在本研究项目中,仅在编制一些图件时有效地应用。

地区土地不稳定性报表记录也考虑了岩石崩落、块体滑动以及潜在不稳定的地段,但是这些没包括在分析过程中。图2显示了用于分析的数据层。

被考虑的全部主题的数据原则上有相互关联的可能性。由于多余的信息将可能导致无效结果,因而做一些尝试性计算。为了分析的目的,已进行了一次对7个主题条件(即,降雨地图、岩石学、土地覆盖、坡度、坡向、与水文网的距离及与线性构造的距离)的联合性试验。7个主题条件分类列入独立的图例内,并作为促使滑坡体产生活动的条件在地图上的识别标准。

对每一个地图偶对做了4个指数的联合计算:

·x平方(x2)指数;

·克拉默(Cramers)指数;

·意外事故指数;

·共同信息不确定性得分。

这里,第一个指数被确定为:

图2 用于预测的原因因素主题图

地质灾害调查与监测技术方法论文集

式中

地质灾害调查与监测技术方法论文集

而 T=象素的总数,Ti=地图1中 i类象素的数量,Tj=地图2中 j类象素的数量。指数 n和m分别是在地图1和地图2中的种类数目。

克拉默指数(V)和意外事故指数(C)确定如下:

地质灾害调查与监测技术方法论文集

相同符号的含义相应同前,同时 M取(m-1,n-1)的最小值,而 n和m分别是两幅图中每一幅中的数据种类的数目。

图幅偶对 A和B的共同信息不确定性得分取决于:

地质灾害调查与监测技术方法论文集

其中

地质灾害调查与监测技术方法论文集

n、m分别是在地图A和地图B里种类的数量,而Pij则是在地图A和B的交会线上i和j种类的像素数量分别对像素总量的比率。Pj是地图A中种类j的像素总数量,而 Pi表示种类i在地图B中的总像素。

上述指标可判断一个地图偶对之间的协调性尺度。x平方指数给出协调性(无上边界的)绝对尺度,而对其本身没用;V和C表示区域内预防标准的尺度[0,1],它们越是接近1,则两张地图之间的联系越强。这3个指标结合使用,可提供关于联系性的一个综合尺度标准,并允许我们超越一套地图从不同角度去比较像对的联系性。通常,可能注意到3个指标呈现如所期望那样非常相似的反应。不确定性共同信息记录也可用于确定由前面的指标测定的联系性模型,并假定在0(完全独立的地图)和1(完全联系的地图)之间改变。表1展示了如上所述的地图计算的指标。

表1 数据层之间的联系性指标

尽管未使用计算的指标,在严格条件下,对于确定贝叶斯条件(比非联系性质更强)的独立性,这些由全部数据层推断而得出的联系性指标,可能应当是独立的。

正如分析所指出的,必须被注意到,滑坡显示出与岩石学的某种联系(只有一个滑坡,岩石学主题由于共同信息的不确定性,具有非相关性),并与海拔高程/雨量以及地表覆盖存在空间联系趋势。

应当指出,若从因果关系以外的因素看来,岩石学与海拔高程/雨量和土地覆盖是相关的,而与坡度之间的联系较弱,与其他主题的联系则极少或无联系。提供给研究项目的不甚适用的DTM似乎是造成这一现象的首要原因。除在坡度和降雨量/海拔高程之间的微弱的联系外,其他联系可能均未予考虑。

根据当地地质调查所的分析似乎也得出同样的结论,岩性的因素仅仅用于编制滑坡灾害图以及拟定作为滑坡灾害指标的每个岩性单位的滑坡频率。

在每次运算期间,只有已知滑坡(通过随意抽样选择)的一半用来生成预测地图,然而剩下的东西,应当视为同样有效的数据群。作为滑坡灾害预测尝试,最先使用潜在原因因素,而在第2次试验过程中,只使用了3个最为相关的因素,这将在后面的章节中予以解释。

4 结果讨论

支持性函数的计算如以下将予以描述的那样,是在不同的模拟假定前提下进行的。每一幅由计算生成的良好地图的预测能力,用曲线的预测比率进行测试。这种曲线,是通过研究地区的累积百分率标定分类,以支持性评定数值的递减量(遵循上面提到的各种法则)作为横坐标,以滑坡地区的累积百分率作为纵坐标而做成的。据说,当预测的滑坡百分比与区域最大值的20%相一致时,便是对模型预测能力的良好评估。更广泛的观念是,曲线越是有规则的接近纵轴,则预测越加吻合。相反,若更多的曲线靠近45°直线,则说明组合因素造成预测靠近支持性数值的随机分布范围,这种预测的有用价值极小。在因果因素中,已经认识到水文网络所起的作用较小,这是因为为其所拟定的细节,要比其他因素的精密度高得多。乍看起来河流切割“遍布”各地,因而不便于将滑坡分布与它和水文网络的距离加以联系。因此,在因果因素中没有包括河流水系。

在图3中对已考虑的6个因果因素的预测比率,逐个予以显示。本项目中,预测者估计的条件频率ppaI,I=1,…n(发生滑坡事件的条件概率,给定的种类 i)适于每个主题内的每一个种类。

图3 原因因素预测的比率——使用整个滑坡封闭折线和条件频率

第一步计算用作证据的数据,来自图解滑坡活动的全部封闭折线。滑坡被分解成两个随机取样组,其中一个用于标定,而另一个用于证实。计算作业使用了3个最相关的主题(岩性、土地覆盖以及海拔高程/雨量),遵照先前描述的指标。预测比率曲线用图4显示。

进一步使用所有的6个指标进行了计算,其预测比率用图5显示。

我们注意到,由于整个滑坡体均被绘制,因而这可能会含有一些精确性的偏差;由于因果因素的集合,致使滑坡触发点和滑坡前缘不相同。因此,在每个滑坡封闭折线内预测,只使用最高点;若从物质运动的运动学原理考虑,触发点应当在最高位置。6个因果指标在此假定前提下计算的预测比率,如图6所示。

图4 7位预测者预测的比率——使用3个因果指标

(岩石学、降雨量和土地覆盖)和整个滑坡封闭折线

图5 7位预测者预测的比率——使用所有6个相关的原因指标和整个滑坡封闭折线

7位预测者使用3个和6个因果指标的预测比率,分别用图7和图8显示。

就输入数据的相关性而论,表明使用坡度、坡向和雨量分布(即更准确的DTM和雨量——由更区域化的降雨计量器获得的数据)具有更好的代表性,将使结果得到改进。一旦得到新数据,分析者们便可重新评价其对预测的潜在影响。

从预测比率的比较中可以确定:

·当使用6种因果指标代替3种与滑坡关联性更好的指标(岩石学、土地覆盖以及雨量)时,似乎没有明显的改进;在两种情况下的预测表现得非常近似,这恰似对种类群用了修整清除器,然而更多的指标是被应用了的。

·更进一步的清除效果可由只用触发点,而无需考虑滑坡整体来作为证据。这不至于带来地图总体预测能力的恶化;但同时也须顾及到,过量的清除有可能会导致绘图的可靠程度降低乃至消失。

图6 只使用触发点因果指标预测的比率

图7 7个预测者只使用3个因果指标(岩石学、土地覆盖和降雨量)和触发点预测的比率

图8 7个预测者使用6个相关因果指标和滑坡触发点预测的比率

·岩石学在原因指标的预测比率图解中,无论如何显然具有更高的预测能力(如此则可理解,为何当地地质调查所单独选择了将这个主题层用于灾害制图),当然还包括土地覆盖和降雨。然而并非其他全部主题都与预测相关。

·在本案例研究过程中,除贝叶斯可能性的情况外,7位预测者所用的预测表现得极其近似。然而数据的有效分布性是非常敏感的,当整个滑坡体被用作证据,并处于模糊“或”、“与”的某些场合时,则预测均近乎为随机性的。通常,似乎确定性系数是预测者在这一具体案例的研究中最有用的手段,虽然在每种情况下,一些预测者以预测比率曲线和预测地图所作出的预测实际上相同。

图9显示了在本案例中,进一步显示了将3个因素与作为主题证据的触发点共同配合使用时的7种预测。这是本案例研究过程中探讨的情况之一,它具有更好的预测比率,并且可能对滑坡灾害成带性作出最佳的基础性思考,显现了当前的认识状态。

图9 根据7种预测做出的预测地图

5 结论

本文讨论的方法是使用数字模型(较少需要专家的主观判断),依据滑坡灾害来划分土地等级。这似乎表明,当客观预测可从空间数据库中提炼出来时,则可以说明其主题有一些“系统”增加的价值,即全部数据都共同使用比仅只使用某些主题的效果更好。

必须强调,这种方法从现有数据库的开发入手,且保留对每个主题认识的开放、完善。在最好的预测者们各种各样的测试(确定性系数、贝叶斯可能性、模糊的 *** 作和其他可能的技术)中,仅能根据各种测试技术的预测能力做出选择,最后则慎重地使用了预测比率曲线进行预测。

这些分析已经引发了现有的数据库尚属不健全的认识,当然,仅指为了生成预测模拟使用目的的地形数据不甚适当而言。这寄希望于未来投入进一步的调查研究并捕获数据,以确定一种更佳的数字化地形模型。只要改进的原因因素地图一旦产生,或者一个新的原因因素被确认与现象相关,便可能重新进行计算,从而可能产生新的预测图。预测比率使用的有效性可按实际和有效改进进行检查,也可用来对数据收集和岩土工程监测的进一步努力指明方向。例如,在本案例研究中,岩性、土地覆盖以及降雨(如上所述,按高程描述)显然是滑坡的最相关的因素,因而到目前为止,分析主要致力于这些因素的调查和编图。更进一步说,准备并使用具有合适解读能力的DTM显得很有必要,其目的是为了更详细地检查地形数据的影响。分析也很重视其他主题条件,例如水体高程,对用于危险绘图时,它可能就变得相当重要。

蛋白质相互作用数据库见下表所示: 数据库名

BIND

DIP

IntAct

InterDom

MINT

STRING

HPRD

HPID

MPPI

蛋白质相互作用的预测方法很非常多,以下作了简单的介绍

1) 系统发生谱

这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。

2

2) 基因邻接

这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个 *** 纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。这个方法似乎只能适用于进化早期的结构简单的微生物。所以在人的蛋白质相互作用预测时不采用这个方法。

3) 基因融合事件

这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。

4) 镜像树

这个方法的思想是,功能相关的蛋白质或同一个蛋白的域之间,受功能约束,其进化过程应该保持一致, 即呈现共进化(CO—evolution)特征,通过构建和比较它们的系统发育树,如果发现树的拓扑结构显示相似性,这种相似的树被称作镜像树,那么,可以推测建树基因的功能是相关的。

5) 突变关联

物理上相互接触的蛋白质, 比如处在同一个结构复合物中的蛋白质,其中一个蛋白质在进化过程中累计的残基变化,通过在另一个蛋白质中发生相应的变化予以补偿,这种现象被称作关联突变。

6)

序列信号关联

3

通过检查实验上已经证实的相互作用蛋白质对,发现序列特征信号

(sequence-signatures)在不同对的相互作用蛋白中重复地出现,这一现象被称作序列信号关联。利用序列域信号关联作为相互作用蛋白质的识别指示,可以预测未知功能蛋白与已知蛋白的相互作用,减少直接实验的搜索空间。

7) 保守的蛋白间相互作用

相互作用的蛋白质在物种演化过程中具有保守性,因此,可以通过在一个物种中建立的蛋白质相互作用网络,预测其它物种的蛋白质间相互作用。这是后基因组时代产生的一个分子进化概念,使人们联想到直系同源基因(orthologs)和平行同源基因(paralogs)两个概念。Walhout首先提出了”interologs”这个新概念,后由Matthews等利用酵母双杂交法分析了1195个酿酒酵母相互作用蛋白在线虫(Celegans)中的保守性,获得了

16%-31%线虫保守相互作用蛋白,它们主要集中在核心代谢过程(core metabolic processes)并预期随着亲缘关系的远近,保守性作相应变化。

8) 同源结构复合物

设想三维结构已知的蛋白质复合物,各自的同家族成员以同样的方式发生相互作用

9) 进化速率关联

蛋白质的进化速率由这个蛋白质同其它蛋白质发生相互作用的数量决定,并呈负相关,即相互作用的数量越多进化速率越低,而不是通常设想的蛋白质的进化速率由这个蛋白质对机体的重要性决定,这是一个极重要的概念。Fraser等13Ol利用一组实验上证实的酵母相互作用蛋白,量化分析了进化速率、适合度(fitness)和序列共进化(sequence CO—evolution)之间的关系;统计分析显示,在酵母蛋白质相互作用网络中,连接点越多的蛋白质进化速率进化越低,可能的原因是,这些蛋白质需要与更多的相互作用伴体(partner)共进化。

10) 共鸣识别模型MRRM预测蛋白质相互作用

从蛋白质一级结构预测蛋白质相互作用,它假设生物分子(包括蛋白质和DNA)之间的相互作用是通过共鸣能量的传递来实现的,RRM恰当地引入了一些蛋白质的物理参数,并且运用了信号分析方法(Digital Signal Analysis,DSP)使得对于蛋白质和基因的分析脱离了局部性。

11) 通过Domain相互作用来预测蛋白质相互作用

Domain是蛋白质最小的功能单元,它们之间的相互作用一定程度上就决定了蛋白质之间的相互作用。按照这个方法将所有的氨基酸序列进行聚类,如果类与类之间的相互作用的序列对的个数超过了一定阈值,则表示与两个类的代表序列同源的蛋白质之间都可能会发生相互作用。

12) 根据蛋白结构来预测蛋白相互作用

Lappe等人认为,虽然蛋白质之间的相互作用并不能直接用作预测,但是在结构上相似的蛋白质将有可能具有相似的功能,至少会给出一定的功能提示。分类的原则可按照SCOP给出的层次进行,分类方法是将已知序列的蛋白质相互作用对分别与SCOP的典型结构进行匹配,使之对应到每一个类中。预测已知与其他蛋白相互作用关系的蛋白的序列结构可以列出该蛋白结构组成的最大可能情况。

一、理论基础

综合信息成矿预测理论是在系统论思想和地质调查工作面临的现实矛盾中逐步发展成长起来的。系统思维方法是进行分析和综合的辩证思维工具,它是把被研究的对象当作一个系统,从系统的整体出发来研究系统的组成部分,各组成部分之间的关系和系统与环境之间的关系。系统思想要求从不同角度把系统的概念贯通、综合,使系统的局部目标服从总体目标。这是系统思维方法的一条原则。在此原则下,系统思想的另一特点是从各部分的联系中探讨系统的总体特征,从而正确地认识整体。系统论以信息论为其基础理论之一,因此它在处理系统问题时特别重视信息的主导作用,并认为具有信息流才能使系统维持正常的有目的的运动。系统论强调信息流对系统的支配、调节和控制作用。用系统科学方法处理问题,总是尽量采用各种逻辑语言和数学工具使系统得到较精确的定量描述,以反映出系统发展变化的规律,认识事物运动的本质。最优化是系统定量化的一种常用方法,它可根据需要为系统定量地确定出最优目标,从而达到最大效益,它是系统科学方法论中方法的核心。

从系统思维方法观点看,地质矿产勘查,包括综合信息成矿预测,将会遇到以下几个方面的问题:

1地质观察研究的不统一性

矿产普查勘探最基本的工作方法是地质调查研究,所产生的地质解释和推断的成果,用于指导矿产普查勘探实践活动。但在地质调查研究过程中,由于专家们所使用的观测手段和观察方法不同,所持的地质理论、观点和地质经验等各个方面的差异,对同一地质现象可能有截然不同的看法,由此带来学术观点的争论。这是地质科学研究中的一个比较普遍的现象,是由地质科学本身的探索性特点决定的,这种争论客观上促进了地质科学的发展。地质观察研究的不统一性,不但是地质科学发展历史上必然现象,而且今后也将长期存在下去。

应当指出,地质观察研究的这种不统一性,为客观的进行矿产预测带来了困难。为了克服这种不统一性,只有通过综合信息解释途径,把各种资料和推断成果有机关联,彼此综合,融为一体,用相对客观的信息更正主观的信息,才能全面、整体地揭示矿产资源的生成和分布规律。这是综合信息成矿预测的基本思路之一。

2矿产普查勘探工作和研究程度的不平衡性

矿产普查勘探的工作部署受制于经济法则,在任何时期,都要用有限的投资去获取最大的社会效益和经济效益。因此,从全国到各个地区矿产普查勘探投入的工作量和地质研究程度永远是不平衡的。我国总体上有东部、东南部研究程度高,西部、西北部研究程度低的特点。山东省也有东部研究程度高,西部研究程度低的特点。对全国来说,随着国民经济的发展,西部矿产资源大调查已经提上日程,用从东部地区总结的矿产资源分布规律指导西部矿产资源的勘查,把研究程度高的地区建立的不同矿种、不同类型、不同等级的矿产资源体综合信息找矿模型和综合信息预测模型应用到研究程度相对较低的地区,可以有效地提高西部矿产资源的勘查效益。

3地质体、矿产资源体的复杂性和地球物理、地球化学、遥感信息的多解性

不同等级地质体和不同等级矿产资源体之间存在着物理性质和化学性质的差异,这种差异通常是以地球物理异常、地球化学异常等形式表现出来。但是自然界的地质体和矿产资源体是复杂的、多变的、不均一的,地质史上对一个地质现象研究探索几十年、上百年是屡见不鲜的。到现在为止我们对地球、地壳的认识还是远远不够的,皮毛的东西比较多。如果说地质体的复杂性还不足以困扰人类的话,地质科学研究中更令人困惑的是地球物理、地球化学、遥感等信息的多解性。在地质手段不足时我们常借助于地球物理、地球化学和遥感等方法去认识地质体和矿产资源体。但是这些方法都有其自己的特殊性和局限性,有时相同的、相似的地质体形成不同的地球物理和地球化学异常,更多的情况是相同或相似的地球物理异常和地球化学异常经常对应着截然不同的地质体和矿产资源体。

4地质体、矿产资源体的特殊性与共性

任何地质体都具有区别于其他地质体的个性,这是我们能够将地质体加以区分的原因所在。矿产资源体是矿产资源的地质载体,同地质体一样,它也具有区别于其他矿产资源体和地质体的个性。从统计观点分析,地质体集合和矿产资源体集合具有本质相似的共性,这些共性特征是对地质体、矿产资源体类型划分和等级划分的基础,也是建立综合信息找矿模型和综合信息预测模型的基础。而地质体和矿产资源体的个性主要应用于对它们的评价。

5地质数据的特殊性

在地质数据的定量化过程中碰到的一个显著特征是地质信息多属于定性变量,这些定性变量需要特殊的提取和赋值,需要特殊的数学工具和统计单元筛选办法。

二、系统方法

综合信息成矿预测理论体系是在理论研究和找矿实践中不断地完善和丰富的。概括地说,它是在地质理论为先验前提的条件下,以地质体和矿产资源体为单元,从地质演化的角度,研究地质、地球物理、地球化学、遥感等多元信息,进行综合解释,进而建立综合信息找矿模型和综合信息预测模型(信息转换模型),用综合信息预测模型为工具对工作研究区进行系统的评估。从而使成矿预测、矿产统计预测和矿产资源量预测成为有机关联的一个整体。综合信息成矿预测流程见图6-1。

图6-1 综合信息矿产预测流程图

1以地质理论为先验前提

综合信息成矿预测理论认为,各种地质理论和科研成果都是对地质体集合和矿产资源体集合的母体进行统计、观察、抽样和度量的结果。这些成果对成矿规律的刻画是相对的和不均衡的,随着观察深度的改变是有变化的,而不是绝对的,即带有统计的特点。因此,所观察、总结的地质理论是在一定研究程度上的认识,对地质成矿规律只能起到一种导向的作用,我们称之为地质先验前提。

另一方面,地质观察研究是通过地质测量直接观察的结果,它具有实际、客观的一面。测量的成果中,必然蕴含着许多表征被测量母体某些成矿特性的有益信息。这些有益信息是对物探、化探、遥感等测量成果进行地质解释的重要依据。特别是从地质演化的角度进行物、化探和遥感信息解释时,这一点就显得尤为重要。

应当指出,各种成矿控制因素的信息,总是以不同的“信噪比”存在于各种测量成果中,只有以地质理论为先验前提,采用合理的分析方法,才能将有用信息从资料中提取出来。所以,综合信息解释工作应当建立在地质理论为先验前提的基础上。

2以地质体、矿产资源体为研究、统计单元

综合信息矿产预测以地质体和矿产资源体为研究、统计单元。从统计观点分析,地质图系是不同性质地质体的组合。各种地质体都是有等级的:如地层可划分为层、组、群和统、系、界等系列单元;构造可划分为不同规模的岩石地层单元组合;侵入岩可划分为岩体、构造侵入岩带等。矿产资源体是矿产资源的地质载体,可分为矿体、矿床、矿田、矿床密集区和成矿带等。

矿产资源体及其集合为成矿预测的对象。地质体集合是矿产资源体的控矿因素,各种地质、地球物理、地球化学、遥感信息是不同等级地质体和不同等级矿产资源体不同侧面的反映。各种地球物理场、地球化学场的类型、强度、形态、分布都是与地质体、矿产资源体的物质成分、产状及埋深相联系的。由于地质体和矿产资源体的复杂性,相同的地质体可以有不同的地球物理、地球化学场;同样的地球物理、地球化学场也可以反映不同的地质体。这种场和地质体对应的不唯一性,带来地球物理、地球化学和遥感信息的多解性。这种多解性一直困扰着地球物理、地球化学和遥感信息的充分应用。

是什么原因造成地球物理、地球化学和遥感信息的多解性呢?如果从这些资料的获取过程来考察我们是会有所启迪的。在观测这些资料时,我们并没有和它们的来源联系起来,实际是对某一地区所有地质单元作为一个整体来观测的,是所有个体的总反应,所以说这种多解性是必然的。

通过多年来的实际工作,逐步认识到只有在地质理论先验前提下,以地质体和矿产资源体为单元,进行各种信息的相互关联、转换和解释,才能有效地克服地质观察的不统一性和物化探的多解性,较全面地反映地质体和矿产资源体的客观面貌。如山东省著名的玲珑花岗岩体,长期在花岗岩地区进行科研工作的专家们认为是混合岩,长期在变质岩地区工作的专家们认为是花岗岩。通过地质、地球物理、地球化学及遥感信息的综合解释,发现玲珑花岗岩体同围岩的磁场特征有明显的继承性,它们是相对的低重力场,通过重力方法可以有效地推断岩体的规模、形态、产状,以及和金矿床、老基底之间的空间分布关系。通过以岩体为单元的多元信息关联,可以看出岩体从整体上对老基底的继承关系,在此基础上我们建立了继承性岩体的地质地球物理解释模型,实践证明这种方法在很多老变质岩区都是行之有效的。

3遵循各学科基本原理,综合利用各种信息

各种地质研究资料和信息都有其自己的理论系统和基本工作方法,我们利用这些资料一定要在其基本理论的指导下挖掘其有用的信息。综合信息解释不是各种信息的杂烩,而是一种有序的、理性的提取、转换和关联,并通过信息的转换和关联实现信息的增值。信息的理性综合利用,给我们提供了认识地质成矿规律的有用工具。如变质岩系层理展布趋势的确定,各种地质体的延深推断,如果没有地质信息和物化探信息的综合利用和信息转换,是不可能实现的。

4以综合信息找矿模型和综合信息预测模型为工具

在成矿模型理论先验前提下,从找矿(矿产资源体)的角度出发,总结客观存在的找矿标志、找矿前提及其综合信息特征,形成一种统计性的找矿模式,即综合信息找矿模型。在建立综合信息找矿模型的基础上,通过直接找矿信息和间接找矿信息的关联和合理的信息转换,建立以间接找矿信息为主体的,适合研究区研究程度的综合信息预测模型。综合信息预测模型的特征,基本上代表了研究区的工作程度和成矿预测的评价准则。

矿产资源体是有不同等级的,有矿体、矿床、矿田、矿带和矿床密集区之分,它们和相应比例尺的成矿预工作相对应,故综合信息找矿模型也是有不同等级的。通常大比例尺综合信息矿产预测建立以矿体、矿床为单元的综合信息找矿模型,中小比例尺则建立矿田、矿带和矿床密集区综合信息找矿模型。在实际 *** 作中,一般先以矿体为单元,建立矿体集合的矿床级综合信息找矿模型,并在此基础上,逐步扩展建立更高等级的矿产资源体综合信息找矿模型。

综合信息找矿模型和矿产预测模型是我们对研究区进行评价的主要工具,它们的建立是紧扣研究区地质成矿发展规律的,这种成矿规律不是单纯的地质现象的总结,而是各种找矿信息的综合表现。为了表达找矿模型的客观真实性和区域成矿预测的资料特点,我们通常首先分别建立地质、地球物理、地球化学等信息模型。这些模型虽然被冠以信息类型,但实际上它们已经是综合信息条件下的单信息模型了,我们可以从下述的地球化学信息模型研究中窥其一斑。

矿体的矿石矿物、围岩蚀变和围岩的地球化学特征的差异性是地球化学综合信息找矿模型的基础,但是这些信息在预测区并不是容易得到的,因此需要有一个信息转化过程。首先从地质演化和找矿的角度出发,确定主矿化阶段的矿物标志组合,研究主矿化阶段的矿物组合和标型矿物特征;其次,研究主矿化阶段矿物组合的元素组合特征,确定主矿化阶段标型元素组合特征,以及不同矿化阶段的矿物组合和元素组合特征。研究主矿化阶段在不同等级矿产资源体矿床、矿田、矿带和矿床密集区的变化规律。研究不同景观地球化学条件下原生晕、水系沉积物和矿床地球化学特征之间的关系。研究形成不同等级地球化学异常的控制因素,是提高成矿预测可信度的重要方面。

综合信息找矿模型是已知的矿体、矿床、矿田等的共性规律的总结,一般的规律是研究程度高的地区易建立找矿模型,但资源潜力小;研究程度低的地区,资源潜力大。综合信息找矿模型要应用于研究程度低的地区,必须考虑研究程度不平衡所带来的信息不平衡问题。因此,建立合理的简化信息模型是必要的。简化的原则是能反映矿产资源评价所必备的基本信息,能达到预测的目的。这种简化找矿模型的信息提取依赖于直接找矿信息和间接找矿信息之间转换,通常把它们称之为信息转换模型和综合信息预测模型。

三、综合信息成矿预测的主要特点

综合信息矿产预测理论及方法有以下几个显著特点:

1强调宏观分析和地质实际观察相结合

综合信息成矿预测是对全国、全省范围的地质、地球物理、地球化学和遥感信息进行综合解释,属于宏观分析。必须同靶区具体的地质观察和验证工作相结合,才能提高矿产资源预测工作的实效,要十几年甚至几十年才能作出正确有效的判断。因此,综合信息成矿预测工作需要跟踪验证工作,只有在找矿实践中反复地检验、修改,才能对地质成矿规律作出正确的认识,对矿产资源存在状态作出客观真实的评价。

2强调综合信息地质背景分析和综合信息异常分析相结合

地质成矿规律的研究总结,多侧重于背景而缺少地质异常分析。地球物理、地球化学研究,多偏重于异常的分析和评价,缺少宏观的地质背景分析。综合信息矿产预测强调应用地质、地球物理、地球化学和遥感信息研究成矿地质背景和综合信息异常,在综合信息的背景中研究综合信息异常,在综合信息的背景中筛选异常。重点是研究矿异常和非矿异常的判别,矿异常的综合信息表现规律。综合信息矿异常是有等级性的,它们和矿产资源体的等级性相对应。

3强调多元信息的关联和转换

以地质体和矿产资源体为单元进行各种信息的关联和转换规律的研究。把地质、地球物理、地球化学和遥感信息有机地融合在一起,根据我们研究工作的具体需要加工、整合、突出目标信息。我们在工作中利用重力、航磁资料数据处理信息推断隐伏基底、隐伏岩体和其他隐伏地质体就是信息关联和转换非常成功的实践。

4强调不同规模矿床的分布规律研究

超大型、大型和中、小型矿床集合的空间分布是有规律可循的,超大型、大型矿床与中小型矿床在空间上具有“鹤立鸡群”的分布形式。这里的“鹤”是指大型、超大型矿床,“鸡群”指中小型矿床。意思是说超大型、大型矿床的产出不是完全随机的,而是非常有规律的,它总是产在中小型矿床的密集区中。因此在成矿预测工作中,很有必要先找“鸡群”,在鸡群中找“鹤”。不同等级矿床之间的这种配置关系,是和老基底及岩浆作用的成矿专属性分不开的。在捐赠作用理论指导下,注意基底矿源层的成矿专属性,衍生矿源层和热源的继承性,这一般是“鸡群”产生的重要物质基础。从地质演化的角度看,大型、超大型矿床往往是在这些有利条件下长期演化、继承的结果。老基底的成矿专属性是最基本的控制因素。

5强调系列预测和系统预测

根据不同的成矿地质条件建立成矿系列综合信息找矿模型,进行多矿种、多类型矿床系列预测。在定性预测的基础上,开展定量预测,使成矿预测、矿产统计预测和矿产资源量预测成为一个有机整体。

6强调GIS的应用

在地理信息平台上,以地、物、化、遥等原始数据为基础,建立综合信息矿产预测知识数据库。以预测目标图层(表达矿产资源体分布状态图层)为因变量图层,以控矿因素图层为自变量图层,以地质体或矿产资源体为研究单元建立因变量图层和自变量图层的因果控制关系,编制各单元的属性表。借助现代计算机技术进行空间拓扑分析,向成矿预测工作的立体化、系统化和思维可视化方向发展。

以上就是关于脉策预测感染是怎么统计的数据全部的内容,包括:脉策预测感染是怎么统计的数据、城市数据库感染预测数据支付宝可以查看吗、预测模拟技术在空间数据库优化开发中的应用——专家系统类比法滑坡灾害制图案例研究等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/9876238.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-02
下一篇 2023-05-02

发表评论

登录后才能评论

评论列表(0条)

保存