两个FASTA文件的合并 python

两个FASTA文件的合并 python,第1张

Python编程将两个文件合并辩戚,代码如下:

//例子:合并a.txt和b.txt文件

def readf(filename):

    lines = file(filename).readlines()

    dic = {}

    for i in lines:

        i_ = i.split()

        dic[i_[0]] 则灶空= int(i_[1])

    return dic

 孙瞎

dica = readf('a.txt')

dicb = readf('b.txt')

 

lines = []

for i in dica:

    percent = str(float(dicb[i])*100/dica[i])+'%'

    s = ' '.join([i, str(dica[i]), str(dicb[i]), percent])

    s += '\n'

    lines.append(s)

//合并成c.txt 

with open('c.txt', 'w') as f:

    f.writelines(lines)

    f.close()

教大家一个简单办法;

1、将所有文局歼迅件放到一个文件夹下,改信如果有顺序提前重命名排序;

001

2、在此文件夹下新建文本文档,后缀名改为 .bat;桐此

002

003

3、右键编辑,将这段指令复制进去点保存,然后双击运行就可以了;

type *.txt >>name.txt

004

005

006

这个就是我们要的目标文件啦,是不是很简单。

mega合并多个FASTA文件的方法:

将多个fasta文件置于D:\PyCharm\py_code\test\RC和D:\PyCharm\py_code\test\KS路径中。

以下代码保存于D:\PyCharm\py_code\test\MergeFasta.py,运行即可得到AllFasta.fasta就好了。

备注:原本fasta的基因名称为NCBI上的名称,重命名后为(Organism)ProteinID.faa,RC和KS即Organism。

fasta格式是一种基于文本用于表示核酸序列或多肽序列的格式。乱如其中核酸或氨基酸均以单个字母来表示,且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。

FASTA格式发明者:

fasta格式,又称Pearson格式,主要发明人帆枝是威廉·皮尔森(William Raymond Pearson)和戴维德.李普曼(David J. Lipman),威廉·雷蒙德·皮尔森是美国弗吉尼亚大学的生物化哗轿启学与分子遗传学教授。

戴维德.李普曼在1989年至2017年期间担任NCBI主任,他也是BLAST算法的发明人之一。1985年3月,双方在科学期刊Science上合作发表了相关成果。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12127936.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-21
下一篇 2023-05-21

发表评论

登录后才能评论

评论列表(0条)

保存