国际著名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。
1、UniProt数据库
蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。
2、The Human Protein Atlas数据库
The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。
瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
3、PhosphoSitePlus数据库
PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些CST公司发现但未发表的蛋白修饰位点。
该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
性能及历史
蛋白质数据库(HPDB),建于2005年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。
分子结构特征描述采用汉语,同时提供英文原文以供考证。对于善于使用英文的读者,我们提倡直接访问RCSB PDB,一来可以减少网络拥挤,二来可以减少由于HPDB的翻译不妥带来的不便。
蛋白质数据库(HPDB)对每个蛋白质分子结构说明部分做了中文翻译(最新加入数据库的分子除外),内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库,因此HPDB支持中文查询。
蛋白质数据库(HPDB)虽然翻译了“分子结构说明”部分,但为了保证数据的可靠性和准确性,HPDB对一级结构序列及大分子结构坐标数据等未做任何改动,数据库保持RCSB PDB核实后的原始实验数据文件,并保持PDB文件格式和蛋白质分子编号。
将PIR、SWISS-PROT和TrEMBL3个蛋白质数据库统一-起来组建而成,包含3个部分:(1) UniProt Knowledgebase (UniProtKB) ,这是蛋白质序列、功能、分类、交叉引用等蛋白质知识库,记录经过人工筛选和注释
■ (2) UniRef ( UniProt Non-redundant Reference )
数据库,将密切相关的蛋白质序列组合到一条记录中,以便提高搜索速度目前,根据序列相似程度形成3个子库,即UniRef100、UniRef90和UniRef50
■ (3) UniParc (UniProt Archive),是UniProt存档库 ,
收录所有蛋白质序列。用户可以通过文本查询数据库,可以利用BLAST程序搜索数据库,也可以直接通过FTP下载数据。
uniprot数据库怎么把氨基酸序列转为核酸碱基序列:(1)在搜索框输入蛋白名(以Cystatin-C为例)之后search,进入下图界面;
①区域即为人物种的Cystatin-C蛋白结果。
(2)点击蓝色ID,进入下一级页面(链接:uniprot.org/uniprot/P01034#ptm_processing);
③区域主要是蛋白名、基因名、物种信息、蛋白研究水平等
(3)红框为蛋白完整氨基酸序列,点击FASTA即可下载此蛋白序列;
(4)下载蛋白序列。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)