两个FASTA文件的合并 python_教程

Python编程将两个文件合并辩戚，代码如下：

//例子：合并a.txt和b.txt文件

def readf(filename):

lines = file(filename).readlines()

dic = {}

for i in lines:

i_ = i.split()

dic[i_[0]] 则灶空= int(i_[1])

return dic

孙瞎

dica = readf('a.txt')

dicb = readf('b.txt')

lines = []

for i in dica:

percent = str(float(dicb[i])*100/dica[i])+'%'

s = ' '.join([i, str(dica[i]), str(dicb[i]), percent])

s += '\n'

lines.append(s)

//合并成c.txt

with open('c.txt', 'w') as f:

f.writelines(lines)

f.close()

教大家一个简单办法；

1、将所有文局歼迅件放到一个文件夹下，改信如果有顺序提前重命名排序；

001

2、在此文件夹下新建文本文档，后缀名改为 .bat；桐此

002

003

3、右键编辑，将这段指令复制进去点保存，然后双击运行就可以了；

type *.txt >>name.txt

004

005

006

这个就是我们要的目标文件啦，是不是很简单。

mega合并多个FASTA文件的方法：

将多个fasta文件置于D:\PyCharm\py_code\test\RC和D:\PyCharm\py_code\test\KS路径中。

以下代码保存于D:\PyCharm\py_code\test\MergeFasta.py,运行即可得到AllFasta.fasta就好了。

备注：原本fasta的基因名称为NCBI上的名称，重命名后为(Organism)ProteinID.faa，RC和KS即Organism。

fasta格式是一种基于文本用于表示核酸序列或多肽序列的格式。乱如其中核酸或氨基酸均以单个字母来表示，且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。

FASTA格式发明者：

fasta格式，又称Pearson格式，主要发明人帆枝是威廉·皮尔森（William Raymond Pearson）和戴维德.李普曼（David J. Lipman），威廉·雷蒙德·皮尔森是美国弗吉尼亚大学的生物化哗轿启学与分子遗传学教授。

戴维德.李普曼在1989年至2017年期间担任NCBI主任，他也是BLAST算法的发明人之一。1985年3月，双方在科学期刊Science上合作发表了相关成果。

欢迎分享，转载请注明来源：内存溢出

两个FASTA文件的合并 python