1 PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2 SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3 PROSITE
PROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4 PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5 SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6 COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
我们都用软件做这个工作,例如Premier Primer 5、Omiga等很多软件都能做。而网站来说,做更多深入分析的网站很多,这一项工作太简单,专门翻译DNA互补链的网站还真不多,可以考虑:
DNA序列分析——ORF Finder(NCBI主页网址/gorf/gorfhtml)
其他功能的网站有:
NCBI-GenBank数据库
数据库相似性搜索——核酸序列与核酸数据库比较(BLASTN)
蛋白质序列与数据库中蛋白质序列比较(BLASTP)
两序列比对(Align two sequences)
分析实验序列外显子部分——GENSCAN
分析实验序列的可能酶切位点——NEBcutter20
限制性内切酶数据库——REBASE
设计引物扩增实验序列——Genefisher
Primer 3
蛋白质序列分析及结构预测:
预测蛋白质的分子量及等电点:ExPASy(Compute pI/Mw)
分析蛋白质的基本物理化学性质:ExPASy(ProtParam)
分析蛋白质的亲水性和疏水性:ExPASy(ProtScale)
分析蛋白质在各种蛋白酶和各种化学试剂处理后的内切产物:ExPASy(PeptideMass)
分析蛋白质的信号肽:ExPASy(SignalP)
预测蛋白质的二级结构:ExPASy(Jpred 3)
多物种分子系统发育分析:EMBL--Toolbox--Clustal2W
人脂联素蛋白质序列:NP_004788
人类胰岛素生长因子IB前体:P05019
NCBI((>
10款相似搜索引擎
1 Picitup
一个相似搜索引擎, 很简单, 输入关键词搜索, 似乎没什么好说的 但它的搜索过程真的是让人觉得非常专业, 比如我输入”android”进行搜索, 可以在搜索结果页通过”面部”, “风景”, “产品”和”颜色”来进行过滤在过滤后的搜索结果页面又可以通过点击某张下面的”Similar Pictures”进行再次过滤。
2 Gazopa
一个全新的搜索引擎,并非传统的使用关键词搜索,而是自动分析图像中的元数据,作为搜索的关键数据,例如,颜色、形状等,寻找相似的。它能根据图像自身的特征从互联网上搜索相似的图像,而不是依靠人为设置的文字描述来搜索。
3 Tiltomo
Flickr 开发的一个搜索工具,主要用来维护Flickr 自己的数据库, Tiltomo的搜索算法主要是基于相似的主题风格或相似的色调和材质:
4 Tineyecom
一种新的在线搜索引擎:不像其它搜索引擎是根据你提交的关键字进行搜索,Tineyecom根据你上传的去搜索相似的。迄今为止,尽管Tineyecom的数据库还不够庞大,但它一直在迅速地成长中。Tineyecom需要注册才能使用,不过大多时候它的搜索结果确实是很精确。
5 Byo image search
是根据你上传的来搜索相似的,算法主要是基于色彩,不过也包括主题风格:
6 Livecom
允许你进行一次关键字搜索后再执行相似性的搜索。你可以为Live索引中的任意一张寻找相似的。但搜索结果看起来并不是很精确:
7 Xcavator
Livecom很相似,你需要先输入一个关键字,然后在搜索结果中挑选一张,在根据这张的特点来进行搜索:
8 Incogna
搜索速度非常快,主要是基于色彩和形状上的相似性:
9 Terragalleria
主要基于视觉上的相似性,而不考虑的内容。
10 Google相似搜索
还待在Google实验室中的相似搜索服务,虽然出生名门,但比起那些专业的相似搜索来说,在它走出实验室之前,确实应该再弄的高级点。
以上就是关于常用的查询蛋白质结构以及序列的数据库主要有哪些全部的内容,包括:常用的查询蛋白质结构以及序列的数据库主要有哪些、有哪位知道专门翻译dna互补链的网站、生物信息学常用的软件有哪些等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)