怎么上传microarray数据到geo数据库

怎么上传microarray数据到geo数据库,第1张

数据库, Geoserver, PostGIS, shapefile, 访问geoserver中一个FeatureType对应一个地图的图层,同一个FeatureType里的所有要素的几何类型都相同,即不允许点和线同层等类似情况出现。FeatureType中规定着这个图层的样式范围等信息,创建它之前,首先要创建“数据库”,也就是数据源。geoserver支持许多不同类型的数据,下面以shapefile和postgis空间数据库为例说明如何添加数据。

在添加数据之前,您需要新建一个名字空间,具体过程如下:

① 使用IE浏览器进入http://localhost:8080/geoserver/页面。

② 点击“配置”,并输入之前您设置的用户名和密码登陆。

③ 再点击“数据”、“名字空间”、“新建”。

④ 输入“前缀”,即名字空间的名字。

⑤ 输入url,例如可以输入贵公司的网址。(前缀和url在今后的客户端xml配置中需要用到)。

⑥ 按下窗口左侧的“应用”、“保存”两个按钮。

如何添加shapefile类型数据到geoserver?

① 首先将××.shp ××.shx ××.dbf文件放入geoserver\data\data文件夹中。

② 使用IE浏览器进入http://localhost:8080/geoserver/页面。

③ 点击“配置”,并输入之前您设置的用户名和密码登陆。

④ 再点击“数据”、“数据库”、“新建”,Feature数据描述选择Shapefile,Feature数据集 ID输入这个shapefile数据源的名称。

⑤ 之后出现“Feature数据集编辑器”界面,名字空间选择您之前设置的名字空间,url中输入file:data/×××.shp,charset输入GB2312。按下“提交”按钮。

⑥ 按下窗口左侧的“应用”、“保存”两个按钮。

⑦ 点击“配置”、“数据”、“FeatureTypes”、“新建”。FeatureType名选择×××:::×××,×××为您上面输入的Feature数据集 ID,按下“新建”按钮。

⑧ 之后出现“FeatureType 编辑器”界面,样式选择一个您设定的样式(样式如何制作在后面将详细介绍)。SRS(空间引用系统)输入数据的坐标系,如果为WGS84那么就输入4326。按下边界盒状模型旁边的“生成”按钮,即可自动生成改shapefile的范围,您可以手动修改这些值。按下页面最下方的“提交”按钮。

⑨ 按下窗口左侧的“应用”、“保存”两个按钮。

在添加postgis数据到geoserver之前,您需要将数据导入到postgis数据库中,如何将shapefile数据导入postgis数据库? *** 作如下:

① 生成sql脚本。使用shp2pgsql程序生成shp文件对应的sql脚本。假定PostgreSQL安装路径为默认,那么单击windows开始菜单、运行、输入cmd、回车。输入命令行"C:\Program Files\PostgreSQL\8.3\bin\shp2pgsql" -W "GBK" D:\×××.shp ××× >D:\×××.sql 其中×××为shp文件名,盘符根据你shp文件所在位置设置。

② 运行步骤1生成的sql脚本,导入数据到数据库。使用psql程序运行脚本。假定PostgreSQL安装路径为默认,那么单击windows开始菜单、运行、输入cmd、回车。输入命令行"C:\Program Files\PostgreSQL\8.3\bin\psql" -d postgis -f D:\×××.sql postgres 其中×××为sql脚本文件名,postgis为数据库名。之后提示您输入数据库密码,输入密码之后,按下回车,自动将数据导入数据库。

如何添加postgis数据到geoserver?

① 使用IE浏览器进入http://localhost:8080/geoserver/页面。

② 点击“配置”,并输入之前您设置的用户名和密码登陆。

③ 再点击“数据”、“数据库”、“新建”,Feature数据描述选择Postgis,Feature数据集 ID输入这个postgis数据源的名称。

④ 之后出现“Feature数据集编辑器”界面,名字空间选择您之前设置的名字空间,host输入Postgis数据库所在服务器的ip地址,如果是本机,那就输入localhost,port输入postgis数据库的端口,默认为5432,database输入postgis数据库的名称,一般为postgis,这取决与您安装postgis时设定的名字。user输入默认的postgres。passwd输入密码。按下“提交”按钮。

⑤ 按下窗口左侧的“应用”、“保存”两个按钮。

⑥ 点击“配置”、“数据”、“FeatureTypes”、“新建”。FeatureType名选择AAA:::BBB,其中AAA为您上面输入的Feature数据集 ID,BBB为postgis数据库中的一个表的名字,这个表应该是您之前导入的。

⑦ 之后出现“FeatureType 编辑器”界面,样式选择一个您设定的样式(样式如何制作在后面将详细介绍)。SRS(空间引用系统)输入数据的坐标系,如果为WGS84那么就输入4326。按下边界盒状模型旁边的“生成”按钮,即可自动生成改shapefile的范围,您可以手动修改这些值。按下页面最下方的“提交”按钮。

⑧ 按下窗口左侧的“应用”、“保存”两个按钮。

生物通报道:长非编码RNA(lncRNA)长达两百个核苷酸以上的转录本,但并不编码任何蛋白质。尽管如此,长非编码RNA在不同组织和发育阶段的表达依然具有特异性,说明lncRNA的调控具有重要的生物学意义。细胞中绝大多数lncRNA(也称lincRNA)位于细胞核,它们对应的DNA区域有的与蛋白编码基因重叠,有的位于基因间或者内含子中。

为何细胞不惜耗费能量对这些非编码RNA的表达和定位进行严格调控呢?这些RNA分子究竟有何功能?RNA测序技术的发展使人们得以初窥这一神秘的分子,现在lncRNA的许多相关信息都可以在新数据库中查到,例如Broad研究所、哈佛大学和麻省理工共同开发的Human Body Map lincRNAs catalog。不过现在人们了解到的lncRNA只是冰山一角,还有大量lncRNA的功能有待科学家们去探寻。

lncRNA研究工具

现在lncRNA研究面临的一个主要挑战是,研究工具还在不断开发和改进中,其中包括设计带有不同lncRNA检测探针的芯片。安捷伦公司的SurePrint G3 Gene Expression v2 microarray就是其中之一,该芯片的探针设计不仅参照主要公共数据库中的mRNA,还参照了Broad研究所开发的lincRNA和TUCP(transcripts of uncertain coding potential)数据库,可以同时检测编码RNA和非编码RNA。据安捷伦公司基因表达产品经理Corinna Nunn介绍,lncRNA的表达水平比编码RNA低,“因此芯片的动态范围宽很重要,这样才能够保证检测到表达水平较低的基因。”

Affymetrix也推出了新版人类全转录本表达谱芯片GeneChip® Gene 2.0 ST Arrays,能够在一张芯片上同时检测mRNA和lincRNA。该芯片的设计结合了多个数据库资源,包括RefSeq、Ensemble、Broad研究所的Human Body Map lincRNAs和TUCP catalog。 “我们的超高密度芯片具有独特的探针,能够检测每个转录本各外显子上的多个位点,确保最大程度的捕捉相关生物学信息,” Affymetrix公司的Tsetska Takova说。生物通 www.ebiotrade.com

Arraystar公司自2009年就开始设计lncRNA芯片,近日该公司刚刚发布了可同时检测mRNA和lncRNA的的第三代lncRNA芯片Human LncRNA Microarray V3.0。Arraystar的技术支持专员Ed Davis介绍说,表达谱往往是研究lncRNA的第一步,不过开发lncRNA表达芯片仍然比较复杂,其中多个lncRNA数据库并存就是一个复杂因素。“为此,我们将公共数据库与重要lncRNA论文中的信息结合起来,建立了一个可靠的综合性lncRNA数据库,” Davis说。此外设计lncRNA探针也并不容易,因为lncRNA常常与附近的蛋白质编码基因重叠。Davis介绍道,“传统芯片探针是‘基因特异性的’,换句话说就是探针靶标转录本的3’端,因此无法区分转录起始位点或剪切方式可变所形成的多种转录本。但Arraystar的探针是‘转录本特异性的’,能够靶标外显子和剪接点,检测到单个基因的不同转录本。”

lncRNA的功能

阐明lncRNA的功能并不容易,Davis介绍道“与microRNA不同, lncRNA能通过多种机制起作用,而且很难依据其序列来推断其功能。” 据Affymetrix公司Takova称,实际上目前已知功能的lncRNA还不足1%。然而,越来越多的研究显示lncRNA在细胞正常分化和肿瘤发生中都具有重要作用。随着人们渐渐了解到正常和疾病状态下非编码RNA的差异,科学家们认为可以将非编码RNA作为生物指标进行疾病诊断和预测。

如何开展lncRNA功能研究呢?专家们介绍,除了表达谱研究以外,与特定lncRNA相关的蛋白编码基因也能够提供lncRNA功能的宝贵信息。Illumina公司RNA和表观遗传学市场经理Chris Streck也认为比起只研究编码RNA,分析整个转录组无疑更有价值。他指出,在ENCODE(DNA元件百科全书)计划的推动下,研究人员现在更注重综合性研究,包括RNA、DNA及调控功能等多个方面,其中非编码RNA的作用日益凸显。(ENCODE项目的目标是在人类基因组中确定所有转录区域、转录因子关联、染色质结构和组蛋白修饰。)生物通 www.ebiotrade.com

BC Cancer Agency的博后Ewan Gibb(Wan Lam实验室)正在研究lncRNA在疾病中的作用。“尽管不少lncRNA都已经有基因组注释了,但大多数lncRNA的功能仍然缺乏证据,” Gibb说。“我很肯定有成千上万的lncRNA都是功能性的,但我们仍需注意,普遍性转录并不意味着具有普遍性的功能。从转录谱着手深入阐明lncRNA的功能是至关重要的。”例如,罗马Sapienza大学的研究团队就阐述了一个lncRNA的功能,它作为内源性的竞争RNA控制着肌肉分化。Gibb指出,lncRNA研究的另一项挑战是找到lncRNA结构与其功能之间的关联。“有研究指出,lncRNA的结构以域为基础,这有点类似于蛋白质编码基因,”他说,“但这种组织形式如何形成,lncRNA的结构与其功能又有何关联,还有待进一步研究。”

在癌症等疾病中的作用

有一点很明确,lncRNA在疾病中有重要作用。lncRNA如何对疾病进程产生强烈影响呢?安捷伦公司资深科学家Anne Bergstrom Lucas介绍了Broad研究所的一项新研究,p53通常抑制着数百个基因,若下调p53相关lncRNA的水平,就会影响这些基因的表达。“指出lncRNA具有肿瘤抑制或致癌的直接作用,将为开发癌症新疗法打下基础,”她说。此外,ENCODE项目的最新进展也显示,约有80%的非编码基因组在基因调控中起作用。

Gibb正针对在人类癌症中表达异常的lncRNA进行功能研究。“一般来说,我们可以用计算机对深度测序所得数据进行分析,以此确定疾病中表达异常的lncRNA。而要阐明这些lncRNA的功能则依赖于传统的生化方法,”Gibb说。“解析lncRNA在人类癌症中的功能,不仅能大大拓展癌症治疗的靶标,也将有助于人们开发新的癌症治疗方法。例如,可以通过反义RNA或靶标lncRNA-蛋白相互作用来进行基因调控。”

已有许多研究显示,lncRNA不仅是调控者,也可以作为疾病的生物指标,例如名为HOTAIR的lncRNA。HOTAIR在原发乳腺肿瘤和转移瘤中的表达都会增加,原发肿瘤中HOTAIR的表达水平可以用来有效预测癌转移和死亡。还有一种称为PCA3(prostate cancer antigen 3)的lncRNA在前列腺癌中高度过表达。这种lncRNA是在尿液中发现的,相当便于临床检测。最近FDA已经批准了一个可以用于临床的商业化检测试剂盒Progensa PCA3 test。此外,据Arraystar的Davis介绍,在肝细胞癌中lncRNA-HEIH也高度表达,可以用Arraystar的LncRNA芯片进行检测。

除了癌症以外,lncRNA调控在一些遗传疾病中有重要作用,例如lncRNA调控异常与短指/趾畸形和HELLP综合症有关。而且有研究显示,lncRNA能够稳定阿尔茨海默症关键酶的mRNA。lncRNA能为我们揭示编码基因以外的疾病调控机制么?“在我看来,最令人兴奋的进展是,有越来越多的证据显示lncRNA与主要人类疾病密切相关,而且lncRNA与蛋白编码RNA相比,能够更好的用于疾病诊断和预后,”Arraystar的Davis说。希望有朝一日,非编码RNA能够成为帮助人们抵御疾病的有力武器。

基因组的基因剂量(盒)-复制号码为某一特定gene-data先前reported4所使用sex-matched参考脱氧核糖核酸(Promega,威斯康辛州麦迪逊广场,)和斯坦福大学人类互补的DNA(一)芯片包含41 421综合分子分析和表达的基因组(图像)财团克隆objects9一(以下简称克隆)对应于27日UniGene集群IDs(290不同功能基因组学设施、斯坦福、加利福尼亚的斯坦福大学。相应的,这些肿瘤的基因表达谱,汇集了正常大脑Stratagene核糖核酸(RNA,加利福尼亚拉)以前reported.10-11原始数据为基因剂量和表达都可以在基因表达的综合性(http://www.ncbi.nlm.nih.gov/geo/)和GSE2223加入GSE1991数字分别在斯坦福芯片的数据库(SMD)(http://smd.stanford.edu/)。一种将计算全息芯片244A安捷伦人类基因组的基因数据量、分型研究技术平台HT人类基因组U133A阵列基因表达的数据集,盘子和临床数据为219,188,207恶性胶质瘤,分别从开放存取和Controlled-Access数据层传送门(http://tcga-data.nci.nih.gov/tcga/findArchives.htm)http://cancergenome.nih.gov/index.asp)对TCGA(国家人类基因组研究所批准。当时的数据检索中,有完整的重叠,TCGA的数据类型用于每个样本。


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/sjk/9984438.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-04
下一篇 2023-05-04

发表评论

登录后才能评论

评论列表(0条)

保存