国际著名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。
1、UniProt数据库
蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。
2、The Human Protein Atlas数据库
The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。
瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
3、PhosphoSitePlus数据库
PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些CST公司发现但未发表的蛋白修饰位点。
该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
性能及历史
蛋白质数据库(HPDB),建于2005年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。
分子结构特征描述采用汉语,同时提供英文原文以供考证。对于善于使用英文的读者,我们提倡直接访问RCSB PDB,一来可以减少网络拥挤,二来可以减少由于HPDB的翻译不妥带来的不便。
蛋白质数据库(HPDB)对每个蛋白质分子结构说明部分做了中文翻译(最新加入数据库的分子除外),内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库,因此HPDB支持中文查询。
蛋白质数据库(HPDB)虽然翻译了“分子结构说明”部分,但为了保证数据的可靠性和准确性,HPDB对一级结构序列及大分子结构坐标数据等未做任何改动,数据库保持RCSB PDB核实后的原始实验数据文件,并保持PDB文件格式和蛋白质分子编号。
1、常用的方式就是通过环境搭建来自建数据库,一般自建数据库可以满足大部分网站的需要,对于流量较大的网站,很有可能读写速度高时导致数据库的可靠性降低。2、RDS对于小流量网站来说其实是鸡肋,普通的自建数据库也是可以完全没有问题的,一个网站在流量小于10万的情况下自建数据库是完全可以承受的。3、日流量在10万以上,或者是百万级别的网站,考虑RDS的话还是可以的。一般情况下,磁盘读取量达到15M/s的时候就是异常情况了,要么是有人在采集你的网站,要么是有人在攻击你的数据库,两者情况区别就在于磁盘读取之后数据库会不会挂掉,目前解决这一问题的方法有很多,其中加强网站防护肯定是必要的,其次如果是网站对数据库可靠性要求很高,又不能在技术层面规避这种攻击的话,就可以选择关系型数据库。欢迎分享,转载请注明来源:内存溢出
评论列表(0条)