OWL(Web Ontology Language)是W3C开发的一种网络本体语言,用于对本体进行语义描述。由于OWL是针对各方面的需求在DAML+0IL 的基础上改进而开发的,所以一方面要保持对DAML+0IL/RDFS的兼容性,另一方面又要保证更加强大的语义表达能力,同时还要保证描述逻辑(DL,Description Logic)的可判定推理,因此,W3C的设计人员针对各类特征的需求制定了三种相应的OWL的子语言,即OWL Lite、OWL DL和OWL Full,而且各子语言的表达能力递增[5]。
OWL Lite是表达能力最弱的子语言。它是OWL DL的一个子集,但是通过降低OWL DL中的公理约束,保证了迅速高效的推理。它支持基数约束,但基数值只能为0或l。因为OWL Lite表达能力较弱,为其开发支持工具要比其他两个子语言容易一些。OWL Lite用于提供给那些仅需要一个分类层次和简单约束的用户[6,7]。
OWL DL(Description Logic,描述逻辑)将可判定推理能力和较强表达能力作为首要目标,而忽略了对RDFS的兼容性。OWL DL包括了OWL语言的所有语言成分,但使用时必须符合一定的约束,受到一定的限制。OWL DL提供了描述逻辑的推理功能,描述逻辑是OWL的形式化基础。
OWL Full包含OWL的全部语言成分并取消了OWL DL中的限制,它将RDFS扩展为一个完备的本体语言,支持那些不需要可计算性保证(no computational guarantees)但需要最强表达能力和完全自由的RDFS用户[6]。在OWL Full中,一个类可以看成是个体的集合,也可以看成是一个个体。由于OWL Full取消了基数限制中对可传递性质的约束,因此不能保证可判定推理。
OWL是一个非冗余的蛋白质序列数据库,是由Leeds大学和Warrington的Daresbury实验室合作开发的(Bleasby等,1994)。OWL数据库由四个主要的一级序列数据库复合而成,即SWISS-PROT、PIR、GenBank(由其编码序列翻译而成的氨基酸序列)和NRL-3D。在构建OWL数据库的过程中,考虑到每个数据库所包含序列信息的情况,赋予它们不同的优先级,SWISS-PROT数据库的优先级最高。在对数据的处理上,不仅删除与某一序列完全相同的序列条目,也剔除与某一序列相差个别氨基酸残基的序列条目。因此,OWL数据库是一个具有较小冗余度的蛋白质序列数据库。尽管如此,与NRDB相同,OWL数据库也会有一些错误,即在该数据库中仍然包括来自一次数据库的错误序列,例如由GenBank中错误序列翻译而得的错误的氨基酸序列。此外,OWL数据库更新较慢。英国的EMBnet国家节点上提供有针对于OWL的BLAST搜索服务。
还可以指owl: object windows library
OWL(object windows library):这是一个Application Framework结构的类库,附含在Borland C++中同MFC类似
你直接在PBD主页上的pbd
ID
or
text
里输入你的蛋白ID,也就是1SA1和1SA0,就能查到你要的蛋白质了。蛋白ID旁边有个Download
Files,点击后选择你要下载的文件格式即可下载。
以下关于PDB数据库描述正确的是:
APDB数据库是一级蛋白质数据库
BPDB数据库存储大分子的3D结构
CPDB数据库里既包含蛋白质的3D结构,也包含核酸的3D结构,以及二者的复合体结构
DPDB数据库里只包含实验方法解析的大分子3D结构
EPDB数据库是二级蛋白质数据库
FPDB数据库只储存蛋白质分子的3D结构
GPDB数据库里既包含实验方法解析的大分子3D结构,也包含计算机预测结构模型
H、X射线衍射法解析的蛋白质3D结构不能提交到PDB数据库
正确答案:PDB数据库是一级蛋白质数据库;PDB数据库存储大分子的3D结构;PDB数据库里既包含蛋白质的3D结构,也包含核酸的3D结构,以及二者的复合体结构;PDB数据库里只包含实验方法解
NCBI数据库,包括
蛋白质序列数据库
是从NCBI多个不同资源中编译整理的。
蛋白质结构数据库
包含来自X线晶体学和三维结构的实验数据。其数据从PDB(Protein Data Bank)获得。
EMBL是欧洲生物信息学研究所
(European
Bioinformatics
Institute,
EBI)创建的一个核酸序列数据库。EMBL的数据来源主要有两部分,一部分由科研人员或某些基因组测序机构通过计算机网络直接提交,另一部分则来自科技文献或专利(Stoesser等,
1998)。EMBL与DDBJ、GenBank建有合作关系,他们分别在全世界范围内收集核酸序列信息,每天都将新发现或更新过的数据相互交换。
DNA数据库的规模正在以指数方式增长,平均不到9个月就增加一倍。1998年1月,EMBL中收录的序列数已超过一百万,包括15,500个物种,其中模式生物的序列占50%以上,它们包括人类(Homo
sapiens),
线虫(Caenorhabditis
elegans),啤酒酵母(Saccharomyces
cerevisiae),小鼠(Mus
musculus)和拟南芥(Arabidopsis
thalania)。
可以利用序列查询系统
SRS(Sequence
Retrieval
System)从EMBL数据库中提取有关信息(Etzold等,1996年)。SRS序列查询系统通过超文本链接将DNA序列数据库和蛋白质序列、功能位点、结构、基因图谱以及文献摘要MEDLINE等各种数据库联系在一起。利用EBI网站提供的BLAST或FastA程序,可以对EMBL数据库进行未知序列同源性搜索。
PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)25维(以二维的形式表示三维的数据)结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。
可参考如下方法:
1) 系统发生谱
这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。
2) 基因邻接
这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个 *** 纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。这个方法似乎只能适用于进化早期的结构简单的微生物。所以在人的蛋白质相互作用预测时不采用这个方法。
3) 基因融合事件
这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。
4) 镜像树
这个方法的思想是,功能相关的蛋白质或同一个蛋白的域之间,受功能约束,其进化过程应该保持一致, 即呈现共进化(CO—evolution)特征,通过构建和比较它们的系统发育树,如果发现树的拓扑结构显示相似性,这种相似的树被称作镜像树,那么,可以推测建树基因的功能是相关的。
5) 突变关联
物理上相互接触的蛋白质, 比如处在同一个结构复合物中的蛋白质,其中一个蛋白质在进化过程中累计的残基变化,通过在另一个蛋白质中发生相应的变化予以补偿,这种现象被称作关联突变。
6)
序列信号关联
通过检查实验上已经证实的相互作用蛋白质对,发现序列特征信号
(sequence-signatures)在不同对的相互作用蛋白中重复地出现,这一现象被称作序列信号关联。利用序列域信号关联作为相互作用蛋白质的识别指示,可以预测未知功能蛋白与已知蛋白的相互作用,减少直接实验的搜索空间。
7) 保守的蛋白间相互作用
相互作用的蛋白质在物种演化过程中具有保守性,因此,可以通过在一个物种中建立的蛋白质相互作用网络,预测其它物种的蛋白质间相互作用。这是后基因组时代产生的一个分子进化概念,使人们联想到直系同源基因(orthologs)和平行同源基因(paralogs)两个概念。Walhout首先提出了”interologs”这个新概念,后由Matthews等利用酵母双杂交法分析了1195个酿酒酵母相互作用蛋白在线虫(Celegans)中的保守性,获得了
16%-31%线虫保守相互作用蛋白,它们主要集中在核心代谢过程(core metabolic processes)并预期随着亲缘关系的远近,保守性作相应变化。
8) 同源结构复合物
设想三维结构已知的蛋白质复合物,各自的同家族成员以同样的方式发生相互作用
9) 进化速率关联
蛋白质的进化速率由这个蛋白质同其它蛋白质发生相互作用的数量决定,并呈负相关,即相互作用的数量越多进化速率越低,而不是通常设想的蛋白质的进化速率由这个蛋白质对机体的重要性决定,这是一个极重要的概念。Fraser等13Ol利用一组实验上证实的酵母相互作用蛋白,量化分析了进化速率、适合度(fitness)和序列共进化(sequence CO—evolution)之间的关系;统计分析显示,在酵母蛋白质相互作用网络中,连接点越多的蛋白质进化速率进化越低,可能的原因是,这些蛋白质需要与更多的相互作用伴体(partner)共进化。
10) 共鸣识别模型MRRM预测蛋白质相互作用
从蛋白质一级结构预测蛋白质相互作用,它假设生物分子(包括蛋白质和DNA)之间的相互作用是通过共鸣能量的传递来实现的,RRM恰当地引入了一些蛋白质的物理参数,并且运用了信号分析方法(Digital Signal Analysis,DSP)使得对于蛋白质和基因的分析脱离了局部性。
11) 通过Domain相互作用来预测蛋白质相互作用
Domain是蛋白质最小的功能单元,它们之间的相互作用一定程度上就决定了蛋白质之间的相互作用。按照这个方法将所有的氨基酸序列进行聚类,如果类与类之间的相互作用的序列对的个数超过了一定阈值,则表示与两个类的代表序列同源的蛋白质之间都可能会发生相互作用。
12) 根据蛋白结构来预测蛋白相互作用
Lappe等人认为,虽然蛋白质之间的相互作用并不能直接用作预测,但是在结构上相似的蛋白质将有可能具有相似的功能,至少会给出一定的功能提示。分类的原则可按照SCOP给出的层次进行,分类方法是将已知序列的蛋白质相互作用对分别与SCOP的典型结构进行匹配,使之对应到每一个类中。预测已知与其他蛋白相互作用关系的蛋白的序列结构可以列出该蛋白结构组成的最大可能情况。
以上就是关于女生说owl什么意思全部的内容,包括:女生说owl什么意思、在pdb 数据库上下载蛋白质、以下关于PDB数据库描述正确的是:等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)