the national center for geographic information and analysis
国家地理信息和分析中心
National Center
for Geographic Information &
Analysis美国国家地理信息分析中心(NCGIA)
国家地理确实不错,但是数据库还是不怎么行,推荐dbduowancom 这个数据库的资料完整程度还是可以的。做任务的话重点推荐>
基因地理工程(Genographic Project)" 是一个五年研究计划,这个项目使用尖端的 DB2 数据库在从成百上千个志愿者身上采集到的 DNA 样本中寻找规律。
IBM 与美国国家地理学会共同寻求线索——我们是谁?我们来自何方?
我们从哪里来?我们怎么来到这里的?大多数科学家都同意,人类很可能是在 50,000 年前始于非洲的。然而对于第二个问题,回答就远没有那么肯定了。最初在中心位置的数千人,是如何发展成遍布全球的 65 亿人的?
IBM 的科学家和工程师正在与国家地理学会(National Geographic Society)合作,探索这些基本问题的答案。“基因地理工程(Genographic Project)” 是一个五年研究计划,这个项目使用尖端的 DB2 数据库在从成百上千个志愿者身上采集到的 DNA 样本中寻找规律。
虽然每个人的 DNA 指纹是独一无二的,但是我们的 DNA 中有一些被称作 “遗传标记(genetic marker)” 的部分,它们一代接一代原封不动地遗传下来,很少有突变。基因工程项目重点研究两种遗传物质中的标记:一种是线粒体 DNA,由母亲传给孩子;另一种是 Y 染色体,由父亲传给儿子。科学家正在使用先进的数据挖掘技术和算法来跟踪世界各地人体中的这些遗传标记,以便创建一棵 “家族树”,从而跟踪人类的完整历史。
“最伟大的历史书就藏在我们的 DNA 当中”,项目带头人 Spencer Wells 博士如是说。
在项目早期,国家地理学会的科学家就意识到,他们需要一个技术伙伴。在他们的科学家和核心参与小组的建议下,国家地理学会找到了 IBM。
研究人员最初只是期望 IBM 为项目的技术性挑战提供解决方案。然而,当两个小组之间举行了几次会议之后,大家发现除了用于项目的硬件和软件之外,IBM 还可以做出远远超出预期的贡献。“在这个项目中,IBM 是真正的合作伙伴 —— 而不仅仅是一个赞助商,” 国家地理的项目主任 Alex Moen 解释道。“他们在项目的每一个方面都有人参与,包括科学方面。”
实际上,Ajay Royyuru 博士和他在 IBM 生物计算中心(纽约约克镇 T J Watson 研究中心的一部分)的小组正在帮忙创建使整个项目可行的算法和分析技术。“诚然,对于一家公司研究机构中的科学家,不应该每天都要求他们参与一个寻求跟踪数万年前人类迁移模式的项目,” Royyuru 说道。“幸运的是,这家公司在巨大的挑战面前没有退缩,所以我们才得以抓住这难得的机遇。”
虽然基因地理工程本身是一项独一无二的任务,但该项目的 IT 小组所面临的问题与各地的系统设计人员面临的问题是类似的:即保证敏感数据的安全,建立标准,在数据库性能与灵活性之间取得平衡,以及处理巨大的工作负载。
远程安全性
住在地球最偏远地区的当地人特别值得注意,因为他们的遗传与其他人群是相互隔离的。为了获得这些重要的样本,野外研究人员已经完成了对老挝、乍得和俄罗斯的考察,并正在计划更多的旅行。
然而,与偏远地区的隔离人群打交道需要面临一些特有的安全方面的挑战。研究人员需要在荒芜地带仍可维持的移动计算电力,还需要在小偷猖獗或者对遗传信息有严格法律保护的地区能保护成员隐私的健壮的基础设施。
为了满足这些需求,由 11 名首席调查员带领的野外研究人员小组装备了强大的 IBM ThinkPad 手提电脑,这些手提电脑使用生物鉴定扫描器来验证用户的身份。这些 ThinkPad 配有定制的数据采集应用程序 DB2 UDB Personal Edition V8,以及用于存储和传输采集到的数据的 WebSphere 软件,此外还有用于与同伴协作的 wiki 和 IM 软件。为提高安全性,存储在科学家手提电脑中的所有敏感数据都经过加密。
IT 小组还采取特殊的预防措施,确保科学研究不受黑客的攻击。在进入野外之前,研究人员为即将到来的考察预订一批预先生成的 ID 号码,即 GPID。由于每个 ID 都与特定的考察和首席调查员相关联,因此任何人都不可能通过猜测 GPID 将虚假数据输入到系统中。
在野外,研究人员为每个参与者分配一个 GPID,并使用一个特别设计的应用程序记录表格化数据;即每个人的语言、种族、地点、身体特征等。
完成初始的数据采集之后,当记录还处在草稿模式下时,科学家可以在 ThinkPad 上的 DB2 数据库中更正数据错误和拼写错误。一旦记录被保存为提交模式,它们会通过一个虚拟专用网(***)被自动传输到一个本地数据分析库(DAR)中。之后,本地数据又被传输到华盛顿的中央 DAR,这个项目的所有科学家可以在那里访问这些数据。
位于澳大利亚、巴西、中国、法国、印度、黎巴嫩、俄罗斯、南非、西班牙和美国的十个地区实验室对 DNA 进行提取和排序。样本保留在地区实验室,而结果则通过 *** 被安全地传输到 DAR。
IBM 将中央 DAR 构建在运行基于 Linux 的 DB2 实例和 WebSphere MQ 的刀片服务器上。目前,DAR 有一万亿字节的存储空间,但是小组计划在年前增加更多的存储。“由于安全性的考虑,我们把[基因地理工程系统]构建得就像银行系统,” IBM 杰出工程师、IT 基础设施设计小组带头人 Peter Rodriguez 解释道。每条记录都保存为一个事务,系统使用多阶段提交,以便在传输过程中发生意外时,科学家可以在本地恢复他们的数据。
标准自由度
除了解决安全性方面的挑战外,IBM 小组还必须解决做研究的科学家们独特的要求。“最大的一个挑战就是建立尚不存在的标准,同时满足已存在的标准,” Rodriguez 说道。
每个科学家都有做事的独门方法,他们都希望在记录数据时拥有很大的灵活性。例如,科学家只想要格式自由的字段,而不是为他们的条目预设的列表。由于他们可能遇到之前不认识的语言和种族,因此需要能够创建新的条目。
然而,从信息管理的角度来看,所有这些格式自由的数据都可能带来问题。拼写上的细微差别都可能使最终的数据分析毫无意义。
作为妥协,Rodriguez 和他的小组为数据采集软件设置了预定义的列表,但是也允许科学家创建格式自由的条目。“自由度对于科学家来说非常重要,” Rodriguez 笑道。“即使他们不用,我们也要确保他们有这个自由度。”不过,为了鼓励科学家使用预定义的列表,当科学家输入一两个字母之后,电子表格就会自动填充字段中剩下的部分。
灵活性与性能的较量
这个项目的另一个关键挑战在于 DAR 数据库的设计。“在每一个信息管理场景中,都存在性能与灵活性之间的剧烈冲突,” Rodriguez 说道,“我们通过使用两个不同的数据库来解决这个问题 —— 如果算上备份,实际上是四个数据库。”
主 DB2 UDB for Linux 数据库包含 Rodriguez 所说的 “神圣的财宝”:整个项目的主记录。为了取得最大的灵活性,表被设计成可以针对一个地方更改数据模型,而不会影响其他地方的数据。例如,在印度的研究人员可能想记录关于种姓的数据,但是那些信息对于在澳大利亚工作的研究人员来说毫无意义。主数据库接受用于印度记录的种姓数据,但是不为澳大利亚的参与者添加该字段。
不幸的是,以这种方式存储的数据具有异构性,当科学家分析数据时,性能要受到影响。由于这个原因,小组只使用主数据库来存储信息,绝不对它进行分析。为了便于分析,小组使用 WebSphere MQ 来填充另一个 DB2 数据库,即 GenoSci,这个数据库执行查询非常快。
公众参与
除了对本土人的研究外,基因地理工程还从大众当中采集 DNA。只需支付大约 100 美元,任何人都可以从基因地理工程网站(见参考资料)购买一个参与工具包。在执行完一次无痛的面颊擦洗之后,再将完成的工具包发回基因地理工程。德克萨斯州休斯顿的 Family Tree DNA 将处理这些工具包,然后将加了条形码编码的样本发送到亚利桑那大学进行提取和排序。结果被送回 Family Tree,后者对数据进行编码,并将其传送到 DAR。
公众参与者可以跟踪他们样本的处理进度,并通过在 Genographic 网站输入他们的 GPID 查看分析结果。结果并没有提供典型的基因地理信息,例如个人的出身或种族关系。相反,它识别每个人的类群(具有相同遗传标记的一群人),并从 60,000 年前开始迁出非洲的我们共同的祖先开始,粗略地描绘类群的迁移。
“在这里,您有机会成为实时发生的研究项目的参与者,” 国家地理学会的 Moen 说道。“如果公众参与者继续在网站上查看他们的 GPID,那么他们可能看到结果更加精确了。”
虽然国家地理学会没有向公众真正开放参与工具包的市场,但热情的响应还是势不可挡。“最初,我们计划五年期间卖出 100,000 个公共参与工具包,” Moen 报告说,“但我们到第一年就卖出超过 100,000 个参与工具包。” 幸运的是,小组已经能够扩大工具包的生产和处理,以满足需求。
迄今为止,大约有来自 125 个国家的 160,000 人购买了工具包,其中大约有 140,000 人返回了他们的工具包。通过野外研究人员的齐心协力,还有上万个其他样本也被收集到。
这个项目 “使人们的眼睛突然一亮,” Rodriguez 总结到。“我们都是同一个家族的成员。它拉近了人们之间的距离。”
人类的足迹
60,000 年前,当人类第一次走出非洲时,他们留下的遗传足迹至今可见。将现代人体中遗传标记的出现和频率画出来,就可以弄清楚古人何时出现迁移,移到了什么地方。
200,000 年前
人类的开端:“1924 年,南方古猿(Australopithecus)” 的发现受到了欢呼,因为它是猿和人类之间缺失的环节,因其种类中最著名的成员 —— 露西而闻名于世。
60,000 年前
亚当:“亚当” 是世上每个男人共同的男性祖先。大约 60,000 年前他居住在非洲,这意味着至少那时所有人都还住在非洲。
50,000 年前
撒哈拉之门:在气候发生变化的古代某个时期,“撒哈拉之门” 可能使人类能够走出非洲,随后又关闭起来。
40,000 年前
猛犸猎人:40,000年前,当人类向北移居到西伯利亚大草原时,他们可能是在追随最大的食物源 —— 成群迁移的猛犸。
30,000 年前
克鲁马努人:克鲁马努人 —— 欧洲最先出现的现代人 —— 留下了相当先进的用石头、骨头和象牙做成的工具。
20,000 年前
冰川时代:由于海平面比当前低 300 英尺,为人类的迁移创造了条件。
练级的话,有用的宏不多,可以做个多开山猫A怪的宏。
#showtooltip
/cast 狂野怒火
/cast 疯乱
/cast 山猫冲锋
像有3、4个怪在一起那种,可以让宝宝上去开怪,然后开这个宏,自己多重射击A掉,天赋:
练级的时候有很多地方的怪很密集,翼龙钉刺加上冰冻陷阱可以做到很好的控制。险境求生的后跳群网,方便你在ADD很多怪的时候,有充足的时间实现单控,灵魂链接的持续回血和狩猎刺激的奥射BIU BIU BIU都是练级很不错的选择。
《国家地理》简介:美国国家地理学会的官方杂志,在国家地理学会1888年创办的九个月后即开始发行。
这本杂志每年发行12次,但偶尔有特版发布则不在此限。杂志内容为高质量的关于社会、历史、世界各地的风土人情的文章;其印刷和之质量标准也为人们所称道。这也使得该刊成为来自世界各地的摄影新闻记者们梦想发布自己照片的地方。
《中国国家地理》,原名《地理知识》,是关于地理的月刊,该刊的文章和经常被中央及地方媒体转载。具有很强的可读性和收藏价值,国内外很多家图书馆已经把该刊作为重点收藏期刊。内容以中国地理为主,兼具世界各地不同区域的自然、人文景观和事件,并揭示其背景和奥秘,另亦涉及天文、生物、历史和考古等领域。是中国大陆著名的有关地理的杂志。因该社隶属中国科学院,有一大批自然地理和人文地理的专家学者作为该社顾问,同时还有许多战斗在科考第一线的工作者与杂志社保持着密切联系,因此具有很强的独家性和权威性。
《华夏地理》俗称《华夏地理杂志》,创刊于2001年2月,涉及地理、生物、科技、考古等各方面内容,从多种角度深度报道不同主题。《华夏地理》作为美国《国家地理》杂志在中国大陆的唯一合作伙伴,和全球32个版本同步刊出美国《国家地理》杂志的精彩内容。2007年7月,《华夏地理》与美国《国家地理》正式版权合作,延续美国《国家地理》120年来探索世界、关爱地球的理念,以震撼的摄影和独到的深入报道,为中国的社会中坚阶层每月带来反映世界变迁的精彩内容。
陈安蜀 李磊 李敏 牛广华 张燕
(中国地质调查局天津地质调查中心)
摘要 地质信息元数据记录了地质数据的信息,又区别地质数据本身,借助地质信息元数据可以方便地实现数据资源的查找、发现、应用、管理和一体化组织。元数据服务是地质信息一站式服务的重要支撑。为了进一步推进华北地区地质成果数据库的应用,在更新维护中心16类地质信息元数据基础上,基于SOA架构开发了华北地质空间数据库目录服务系统,对于地质信息元数据服务利用具有很好的借鉴意义。
关键词 地质信息元数据 SOA 架构 目录服务
元数据(Metadata)是“关于数据的数据”,用于描述数据的内容、质量、表示方式、空间参考系、管理方式、数据的所有者、数据的提供方式以及数据集的其他特征[1]。地质信息元数据就是对地质数据描述的数据,地质信息元数据有3种用途:一是作为数据的目录,提供数据集内容的摘要;二是有助于数据共享,提供地质信息转换和使用所需要的数据内容、形式和质量方面的信息;三是内部文件记录,用以记录地质信息的内容、组织形式、更新维护情况等[2]。在地质调查中,地质信息元数据对地质调查空间信息的编目、管理、发布和社会服务起到了重要的指导和推进作用,帮助和促进人们有效地定位、评价、比较、获取和使用相关数据[3]。
1 地质信息元数据标准
自从开展数字国土以来,地质调查信息元数据先后采用了两种标准:一是《地质调查元数据内容与结构标准》(2001 版),二是《DD2006—05 地质信息元数据标准》。
《地质调查元数据内容与结构标准》是由8个数据表来描述数据集,元数据格式为以Access 2000为平台的“mdb”文档形式。
《DD2006—05 地质信息元数据标准》中的元数据数据集由7个子集(UML 包)和14个代码表来描述数据集(图1)。元数据格式为xml编码格式和txt文本格式。其中元数据信息、标识信息、数据质量信息、内容信息是必选子集,空间参照信息、分发信息、引用和负责单位联系信息是可选子集,引用和负责单位联系信息是公用信息子集(表1),数据子项约230项。
图1 地质信息元数据概念结构图
表1 地质信息元数据标准内容
2 地质信息元数据的更新维护
目前华北地区不同专业的地质信息元数据共有16种,主要涉及国家基础地质数据库更新维护的各类数据库以及矿产资源潜力评价专题数据库的元数据,总计20427个(表2)。
表2 华北地区地质信息元数据情况表
由于地质资料中地质信息元数据是在不同时期建立的,元数据依据的标准与格式也不相同,只有统一的标准是能够规范的采集元数据和提供元数据信息服务的基础[4]。为了统一管理和服务,我们按现行的《DD2006—05 地质信息元数据标准》对以前完成的地质信息元数据进行整理与规范。
中国地质调查局发展研究中心按《DD2006—05 地质信息元数据标准》制定了地质信息元数据模板(地质信息元数据_ sample),开发了元数据采集器(Metadata_Editor)(图2)。因此在元数据更新维护过程中,依据地质信息元数据模板(地质信息元数据_sample),采用元数据采集器来整理规范元数据,可有效地保证元数据的统一性和准确性。
对元数据的更新维护主要从以下4个方面开展工作:
21 元数据XML文件错误
对于不能导入元数据采集器的元数据,通过程序,罗列出XML数据错误的元数据及其错误所在行列,对文件内容进行修改,如一些手工填写错误和文件类型错误,在此都进行了纠正,最后修改的数据也都经过了元数据采集器验证。
图2 地质信息元数据采集器界面
22 空间信息的整理
对元数据拐点坐标内容的准确性进行核实,通过空间数据比对,对元数据中填写错误的拐点信息进行更正,对不足小数位数的拐点补齐了小数位,使其数据精度更为准确。
23 字段内容的规范
通过编写批量处理XML数据程序,对元数据中字段内容共性的问题进行统一修改。具体修改内容如表3所示。
表3 元数据整理完善情况表
24 关键内容补充
(1)对关键词填写内容进行补充与规范
关键词001(标识学科分枝的关键词)的规范,区域地质图空间数据库统一规范为“区域地质图、空间数据库”
关键词002标识位置的关键词规范为“省、图幅涉及的市与县”
关键词004标识与数据集相关时间段的关键词规范为“建库时间”
关键词005标识特别的主题或论题的关键词的规范,区域地质图空间数据库统一规范为“区域地质图,地理信息系统”
(2)对验收意见具体内容进行补充与核实
部分数据库元数据提交时验收意见尚未下发,全面收集数据库的验收意见,补充完善到元数据中。
3 地质信息元数据的开发应用
做好地质资料数据服务工作,以快速方便的方式将这些数据信息提供给广大地质工作者,让国家地质数据库得到广泛的应用,是当前面临的主要问题[4]。
中国地质调查局发展研究中心依托网络采用B/S结构,开发了地质信息元数据管理系统(MDIS),授予大区中心超级管理员权限,可以在统一平台发布多元、异构数据库的信息,达到集群化、一站式社会化服务的目的。目前天津地调中心大部分地质信息元数据已经上传到该管理系统中,对外提供社会化服务。
为了进一步提高各种地质信息数据的共享水平和利用率,推进华北地区地质成果资料的应用服务,在构建地质信息元数据库基础上,基于SOA架构[5]开发了“华北地质空间数据库目录服务系统”。用户通过简单 *** 作利用GIS空间查询与属性查询可快速定位所需的空间数据信息,并能查询下载到该信息的元数据。
系统开发基于ArcGIS for JavaScript API,使用的关键技术包括地图缓存技术、ArcGIS Server构筑空间数据平台技术、基于Web服务实现地理空间数据的共享应用模式技术、基于RIA技术的应用技术、先进的AJAX 运用技术、基于 ArcSDE 技术的长事务处理技术、地图 Mashup 应用技术。实现的基本功能:①GIS浏览(如放大、缩小、漫游、平移、鹰眼、经纬度显示);②底图切换,通过构建离线地理底图缓存地图服务,实现系统提供的ArcGIS 底图、Google离线底图、Google Earth底图切换,满足一些敏感数据的查询与使用;③空间查询,主要有基于标准分幅数据(1:5万、1:20万和1:25万)的空间查询、输入极值坐标与拐点坐标串的空间范围查询、整装勘查区、成矿远景区与成矿区带的业务数据空间查询、行政区查询、矩形或多边形的图形查询;④属性查询,对当前视图范围内的数据通过匹配关键词来进行属性查询;⑤查询结果筛选与显示,显示查询结果数目,对空间查询和属性查询出的结果可以再结合省份、矿种和专业进行筛选,显示信息与空间范围可以联动,对xml元数据信息以链接的形式显示,并提供下载元数据文件;⑥成果输出,对满足查询条件的结果导出Excel表,满足对外服务的需要[6]。
总之,地质信息元数据承担着地质资料数据资源查找、发现、应用、管理和一体化组织的重要任务,在地质信息更新维护过程中,地质信息元数据的规范性与准确性都应该得到充分的重视。除了传统的元数据目录服务方式外,基于元数据自身的空间信息,我们实现了基于元数据的空间目录服务,有效的扩展了元数据的服务方式与范围,对于地质资料实现了集群一体化管理,更好的发挥了社会化服务功能。
参考文献
[1]温英明,陈浩,代琦基于XML的煤矿地质元数据目录服务研究[J]硅谷,2010,(14):96~97
[2]李丰丹,李超岭,李浩川,等地质空间信息元数据服务模式的实现[J]地质通报,2008,27(5):700~707
[3]周敏,汪新庆非规范化在元数据管理中的应用[J]计算机应用,2012,32(S2):26~28
[4]王成锡,张明华国家地理信息元数据管理系统的开发[J]国土资源信息化,2011,(2):12~15
[5]Dave Peters地理信息系统设计策略与构建[M]北京:测绘出版社,2012
[6]李磊,陈安蜀,郑锦娜华北潜力资源评价元数据空间目录服务系统建设[J]西北地质,2013,46(增刊):199~202
以上就是关于the national center for geographic information and analysis是个什么组织全部的内容,包括:the national center for geographic information and analysis是个什么组织、寻求 魔兽世界资料网站!!、GPID是什么啊等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)