使用Linux版的MEGA构建某一基因家族的基因进化树

使用Linux版的MEGA构建某一基因家族的基因进化树,第1张

最近碰到了个需求,让我构建某一基因家族的进化树,并根据进化关系进行相应的分类。这让我想起了之前上课的时候,一个做进化的老师给我们讲过,如果不是纯做进化方向的课题,MEGA完全够用了。由于windows的内存等有限,做几十个基因还凑合,要是上百个基因就吃不消了,于是就想到了用Linux下的MEGA来做。

https://www.megasoftware.net/

由于是二进制文件,直接解压缩,添加到环境变量就可以用了。

具体请看我这篇文章。 https://www.jianshu.com/p/5fd60c818651

上一步我得到了该基因家族的所有基因家族的蛋白序列,然后我用windows下的MEGA的 muscle 算法进行了比较,【align-build alignment-上一步的基因家族蛋白序列-muscle比对-data-export-FASTA format】

最终我得到了比对后的 multiproteins.fasta 文件。

首先进行参数的解读,相比于其他软件,我觉得这款软件比较好理解,也容易上手。

这里的 .mao 文件尤为重要,较为简单的方法是拿到windows下去设置,具体请看组学大讲堂的这篇推送。

https://www.omicsclass.com/article/568

版本信息

MEGA version 10.1.8

For 64-bit Linux

Build 10200331

参数解读

EXAMPLES

This example performs a multiple sequence alignment on codons (it assumes that you have created the file "Clustal_Codon_Alignment.mao" using the prototyper (megaproto). A fasta file with coding data is used as input and the resulting alignment is output in the MEGA format:

This example shows how to construct a neighbor-joining phylogeny for each of a list of sequence data files.

The analysis will be performed for each file listed in "listOfDataFiles.txt" and all results will be written to

the ~/Documents/outputDirectory/ directory:

megacc -a ~/Documents/NJ_Tree_Settings.mao -l ~/Documents/listOfDataFiles.txt -o ~/Documents/outputDirectory/

LIST FORMAT

When using the -l option, each file to be analyzed must be on its own line. For example:

~/Documents/myData/seqData1.fas

~/Documents/myData/seqData2.fas

~/Documents/myData/seqData3.fas

If the analyses are to use a user-provided Newick tree file, then the tree files are given on the same line as the data files, following two pipe characters. For example:

~/Documents/myData/seqData1.fas || ~/Documents/myData/treeFile1.nwk

~/Documents/myData/seqData2.fas || ~/Documents/myData/treeFile2.nwk

~/Documents/myData/seqData3.fas || ~/Documents/myData/treeFile3.nwk

我的最终使用:

下一步我打算用 ggtree 来美化,具体学习情况,我再更新。

pstree

pstree显示正在运行的进程的树形结构,树以PID为根;如果省略了pid则以init为根。如果指定了用户名,则显示根植于该用户拥有的进程的所有进程树。如果pstree被调用为pstree.x11,那么它将提示行尾的用户按RETURE,并且在这种情况发生之前不会返回。这对于在x终端中运行pstree非常有用。

pstree通过将相同的分支放在方括号中并以重复计数作为前缀,在视觉上合并它们。例如:

init-+-getty

|-getty

|-getty

‘-getty

变成下面的样子

init---4*[getty]

进程的子线程在父进程下找到,并以大括号显示进程名,例如:

icecast2---13*[{icecast2}]

此命令的适用范围:RedHat、RHEL、Ubuntu、CentOS、SUSE、openSUSE、Fedora。

1、语法

pstree [选项]

2、选项列表

选项

说明

-a

显示每个进程的完整指令,包括路径、参数

-A

使用ascii码显示树形

-c

关闭精简表示法

-G

使用VT 100线条绘制字符

-h

高亮显示正在执行的程序

-H

类似“-h”,但是突出显示指定的进程。与-h不同,如果高亮显示不可用,pstree在使用-H时会失败。

-l

长格式显示

-n

以进程号排序,默认以名字排序

-p

显示pid

-u

显示用户

-U

以utf-8显示字符

-V

显示命令版本信息

-Z

每个SELinux的上下文

3、实例

1)显示完成的树形结构

[root@localhost ~]# pstree -a

init

├─NetworkManager --pid-file=/var/run/NetworkManager/NetworkManager.pid

│ ├─dhclient -d -4 -sf /usr/libexec/nm-dhcp-client.action -pf /var/run/dhclient-eth0.pid ...

│ └─{NetworkManager}

├─VBoxClient --clipboard

│ └─VBoxClient --clipboard

2)显示进程号

[root@localhost ~]# pstree -p

init(1)─┬─NetworkManager(6362)─┬─dhclient(6377)

│ └─{NetworkManager}(6379)

├─VBoxClient(7869)───VBoxClient(7870)───{VBoxClient}(7872)

├─VBoxClient(7882)───VBoxClient(7883)

├─VBoxClient(7890)───VBoxClient(7891)───{VBoxClient}(7894)

├─VBoxClient(7898)───VBoxClient(7899)─┬─{VBoxClient}(7901)

│└─{VBoxClient}(7903)

├─VBoxClient(7306)───VBoxClient(7308)

├─VBoxClient(7312)───VBoxClient(7314)───{VBoxClient}(7317)

├─VBoxClient(7318)───VBoxClient(7320)─┬─{VBoxClient}(7323)

│└─{VBoxClient}(7325)

进化树在生物学中,用来表示物种之间的进化关系。生物分类学家和进化论者根据各类生物间的亲缘关系的远近,把各类生物安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系。在进化树上每个叶子结点代表一个物种,如果每一条边都被...


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/8299184.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-15
下一篇 2023-04-15

发表评论

登录后才能评论

评论列表(0条)

保存