索引表
和
主文件
两部分构成。
索引表
是一张指厅灶示逻辑记录和物理记录之间扮顷扮对应关糸的表。索引表中的每项称作索引项。索引项是按键(或逻辑记录号)顺序排列。若文件本身也是按关键字顺乎扒序排列,则称为索引顺序文件。否则,称为索引非顺序文件。
再不行,你就去百度搜搜。好多你要找的知识。
(1)索引顺序文件(Indexed Sequential File)主文件按主关键字有序的文件拆雀称索引顺序文件。在索引顺序文件中,可对一组记录建立一个索引项。这种索引表称为稀疏索引。(2)索引慎灶非顺序文件(Indexed NonSequentail File)主文件按主关键字无序得文件称索引非顺序文件。在索引非顺序文件中,必须为每个记录建立一个索引项,这样建立的索引表称为稠密索引。注意:① 通常将索引非顺序文件简称为索引文件。② 索引非顺序文件主文件无序,顺序存取将会频繁地引起磁头移动,适合于随机存取,不旅孝早适合于顺序存取。③ 索引顺序文件的主文件是有序的,适合于随机存取、顺序存取。④ 索引顺序文件的索引是稀疏索引。索引占用空间较少,是最常用的一种文件组织。⑤ 最常用的索引顺序文件:ISAM文件和VSAM文件。其中1和3二选一就可以,因为最后需要的是基因组索引文件,索引文件是由比对软件利用基因组序列构建而来。所以
https://www.ncbi.nlm.nih.gov/genome/?term=
输入物种的英文名:human,就可以检索到相应物种的基因组信息还有基因组注释文件。
选择需要的物种名称,就会转到相应网页
http://asia.ensembl.org/index.html
右携歼散侧Download FASTA
与上述基辩氏因组在同一页面
点击Download genome annotation in GFF,或右侧FTP Human annotation (GFF)。
与上述基因组在同一页面
abinitio flag为预测的基因改茄,96为注释文件版本号,因为注释文件会不定期更新。patch为ncRNA?
Hisat2:
http://ccb.jhu.edu/software/hisat2/faq.shtml
Bowtie2:
http://bowtie-bio.sourceforge.net/bowtie2/index.shtml
Bowtie
http://bowtie-bio.sourceforge.net/index.shtml
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)