1、Genome收录的物种涉及所有的生物领域:细菌、古细菌、真核生物,以及许多病毒、噬菌体、类病毒、质粒以及含有遗传物质的细胞器。
2、Gene数据库收录全部已测序物种的基因注释信息,包括基因的名称、染色体定位、基因序列和编码产物(mRNA、蛋白质)情况、基因功能和相关文献信息等,并与GenBank、OMIM、遗传多态数据库(如dbSNP、dbVar)等NCBI子库,及KEGG、GeneOntology等外源性数据库进行交叉引用。
3、GenBank是NIH遗传序列数据库,集成了所有公开可获得的已注释DNA序列,其收录的核酸序列数据根据不同的研究属性,分属于Nucleotide、GSS和EST三个子库。
已知蛋白质可应用X射线晶体衍射法测定其三维空间结构
利用核磁共振法了解其构象
DNA和蛋白质测序技术
可测定其一级结构、也就是你所说的核酸序列
至于 知道蛋白质名字 找到核算序列
只能是别人 测过的
用Nucleotide数据库搜索
或者是 你知道了氨基酸序列
可通过密码子对应表知道核酸序列
起始密码子:甲硫氨酸AUG 缬氨酸GUG
终止密码子:UAA UGA UAG
简单的用C读取文件的例子代码片段。... ...
FILE *fp
char buffer[1000]
fp=fopen( "input.txt", "r" )
while ( fread(&buffer, sizeof(buffer), 1, fp )==1)
{
... ...
//对从文件读出来的数据在此处进行处理
... ...
}
fclose(fp)
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)