MEGA软件的使用.doc
14页MEGA软件的使用Mega是一款操作十分简便的遗传学分析软件,其界面十分友好,即使初学者也很易上手1、数据的录入及编辑Mega软件能够接受多种数据格式,如FASTA格式、Phylip格式、PAUF数据格式等等而且Mega软件专门提供了把其他格式的数据转换位Mega数据格式的程序首先,打开Mega程序,有如下图所示的操作界面:单击工具栏中的“File按钮,会出现如下图所示的菜单:开曾经打开的数据,一般会保留新近打开的几个数据)、“CloseDa(关闭数据)、“ExportDa(导'出数据)、“ConverToMEGAForma将数据转化为MEGA格式)、“TextEditor(数据文本编辑)、“PrinterSetup(启动打印)、“Exit(退出MEGA程序)单击“OpenDat选项,会弹出如下菜单:浏览文件,选择要分析的数据打开,单击打开”按钮,会弹出如下操作界面:此程序操作界面,提供了三种选择数据选择:NucleotideSequences(核苷酸序列)、ProteinSequences(蛋白质序列)、PairwiseDistance(遗传距离矩阵)根据输入数据的类型,选择一种,点击“0K即可。
如果选择“PairwiseDistanee则操作界面有所不同;如下图所示:根据遗传距离矩阵的类型,如果是下三角矩阵,选择“LowerLeftMatrix即可;如果是上三角矩阵,选择“UpperRightMatriX即可点击“0K按钮,即可导入数据如果是核苷酸数据,则读完之后,会弹出如下对话框:如上图,如果是编码蛋白质的核苷酸序列,则选择“Ye按钮;如果是不编码蛋白质的核苷酸序列,则点击“Nc按钮之后,会弹出如下操作窗口:此作界面的名称是“SequencDataExplorer:在其最上方是工具栏“Data”“Display”“Highligh等,”然后是一些数据处理方式的快捷按钮,在操作界面的左下方是每个序列的名称显示序列占了操作界面的绝大部分,与第一个序列相同的核苷酸用“表示,发生变异的序列则直接显示2、遗传距离的计算点击Mega操作主界面的“Distanee按钮,会弹出一个下拉菜单如下图所示:从上图易知,此菜单包括如下选项:“ChooseModel”(选择模型,即选择计算遗传距离的模型)、“ComputePairwis(计算遗传配对差异)、“ComputeOverallMeaS(计算包括所有样本在内的平均遗传距离)、“ComputeWithGroupMeans(计算组内平均遗传距离)、“ComputeBetweenGroupsMea计算组间平均遗传距离)、“ComputeNetBetweenGroupsMeans(计算组间平均净遗传距离)、“ComputeSequeneeDiversity计算序列分歧度)。
ComputeSequeneeDiversity选项包括四个子菜单:“MearDiversityWithinSubpopulations”亚群体内部平均序列多态性)、“MeanDiversityforEntirePopulation”整个人群平均序列多态性)、“MeannterpopulaionalDiversity('群体内部平均序列多态性)、“CoeffieientofDifferentiation(遗传变异系数)点击“ChooseMode选项,会弹出如下操作界面:从上述操作界面可以看出,通过此对话框可以选择计算遗传距离的模型等DataTyp显”数据的类型:Nucleotide(Coding)(编码蛋白质的DNA序列)、Nucleotide(不编码蛋白质的DNA序列)、AminoAcid(氨基酸序列)通过“Mode选项可以选择,计算遗传距离的距离模型点击“Model一行末端的按钮会弹出一选择栏Mudeo11deSyn-lionsynoiLymcra.s卜Amin*Acid*o£Diff-ererLcesKimura2~ParsineterTarn-ura3一F鮎初宅讥电匸T迪iirrIkiL&gDet(TajiirraKketiar)如上图所示,对于非编码的核苷酸序列Mega程序提供了八种距离模型:“NumberofDifferenc&核苷酸差异数)、“Pistanee(”距离模型)、“JukeCantor(Jukes和Cantor距离模型)、“Kimura2-Parameter”(Kimura双参数模型)、“TajimNei”(Tajima和Nei距离模型)、“Tamura3-parameter”Tamura三参数模型)、“Tamu-Nei”(Tamura和Nei距离模型)、“LogDefTamurakuma(”(对数行列式距离模型)对于编码的核苷酸序列,其遗传距离模型如下图所示:…NMcleotide►tiei-Gajobori卜Modifilfti-Gojofcori•虻innAeidLi-Vu-LnoMethodKunffieth-Q4如上图所示,对于编码蛋白质的DNA序列,Mega程序提供了一下几种模型:“NeGojoboriMethod,”“ModifiedNeGojoboriMethoed、”“-W/u-LuoMethod”“Pami-Bianchi-LiMethod”、“KumaiMethod”。
其中Nei-Gojobori方法和修正的Nei-Gojobori方法都包含三种距离模型:“NumberofDifferences“Pistanee、”“JukeCSantor”对于氨基酸序列,Mega所提供的遗传距离模型如下图所示:dNucLeotide•Syn~Nflnsynonymqus*No.ofDifferAlicesPoiEsonCourectionEqualIn-putAininoAcid卜|PW1IM-atrix:(jDiyhofE)JTTMatrix(Jonisr-Ta^lor-Thornton)如上图所示,对于氨基酸序列,Mega程序提供了一下六种遗传距离模型:“NumbeofDifferences(氨基酸差异数)、“Pistanee'(P距离模型)、“PoissonCorrection(泊松校正距离模型)、“EqualInpu(等量输入距离模型)、“PAMMatrix(Dayhoff)”(PAM距离矩阵模型)、“JTTMatrixJones-Taylor-Thornto"”(JTT距离矩阵模型)在“AnalysisPreferenc操作界面中,“PatternAmongLineage仅提供了一个选项:“Sam(Homogenous)”,“也就是说样本之间是有一定同源性的。
Ratesamongsites提供了两个选项:“UniformRate和“Differe(GammaDistributed)”UniformRate意味着所有序列的所有位点的进化速率是相同的选择“Different(GammaDistributed)”,意味着序列位点之间的进化速率是不相同的,可以利用Gamma参数来校正,系统提供了四个数值可供选择:、、软件使用者也可以自行决定Gamma参数的大小设置完毕后,在此界面中点击“OKS钮,即可返回Mega操作主界面选择主操作界面“Distanee中的“ComputePairwise选项,可以计算样本之间的遗传距离的大小,其操作界面如下图所示:“DataTyp显示数据的类型,图中为“Nucleotideo”“Analysi显示计算分分析的类型,图中为“PairwiseDistaneeCalculation配”对差异距离计算)Compute”示所要运行的对象,又两个选项:“Distaneeonly(仅计算遗传距离)和“Distance&(计算遗传距离和其标准误)IneludeSite显示利用哪些位点来计算,如果数据类型是不编码蛋白质的核苷酸序列,则全部参与计算,如果是编码蛋白质的核苷酸序列,则可以选择哪些位点(如密码子的第2位等)来参与运算。
SubstitutionMode是替代的模型,在下边“Model中可以进行选择“SubstitutenstoInclued选择哪些替代类型(如下图所示)被用于运算,d选项将转换和颠换全部包括在内,s选项仅包括转换,v选项仅包括颠换,R为转换和颠换的比值,L为所有有效的普通位点的个数i±Transitions+Transversians|d:Transitions十Transversions£Transitionsodyv;onlyR=s/vL:No.ofVabd匚omrrwnSitesPatternamongLineage和“Ratesamongsite上文已有介绍,不再详述点击“Compute按钮,即可开始计算其显示运算结果的界面如下图所示:上图是计算出的各个样本之间的遗传距离的矩阵在最下端的状态栏,显示的是所利用的遗传距离模型,如图中所示:Nucleotide:Kimura2-parameterFile按钮共有四个下拉菜单:“ShownputDataTitle(显示输入数据的标题)、“ShowAnalysisDescription显示分析信息的描述)、“Export/PrintDistanee(输出或打印距离矩阵)、“Quitviewer(退出此操作界面)。
Display钮共有四个下拉菜单:“ShowPairName显示配对序列的名字)、“SorSequenee”(用何种方式对序列进行排序)、“Show^ame§(显示序列的名字)、“ChangeFont('改变字体)SortSequene有两个选项:“Original(按原先输入的顺序)和“ByName(通过序列的名字)点击“Averag按钮可以计算平均的遗传距离,此按钮提供了四个下拉菜单:“Overall所有样本之间的平均遗传距离)、“WithinGroups(组内平均遗传距离)、“BetweenGroups('组间平均遗传距离)、“NetBetweenGroups(组间平均净遗传距离)在上述按钮下方还有六个按钮,如下图所示点击第一个按钮可以使数据以下三角矩阵的方式显示;点击第二个按钮可以使数据以上三角矩阵的方式显示;选中第三个按钮可以显示配对的序列的名字,点击第四个按钮,可以减少数据小数点后的位数;点击第五个按钮,可以增加数据小数点后的位数;拖动第六个按钮中的小竖条可以改变数据显示的宽度点击“File下拉菜单中的“Export/PrintDistanee选项”会弹出如下图所示的对话框:“OutputForma选项可以确定输出数据的格式:“Publication(一般格式)和“Mega(Mega格式,把此数据保存可直接由Mega程序打开,进行构建系统发育书等遗传分析)。
DecimalPlaces(小数位的大小),“MaxEntriesperline(每一行最多能显示的数据的个数)通过“Matrix可以选择输出数据矩阵的方式:“Loweheft”(下三角矩阵)和Upperight”(上三角矩阵)点击“Print/SaveMatrix按可以输出数,会弹出如下图所示的操作界面:在上图中的数据和文字可以直接进行拷贝,粘贴到文本文档或MicrosoftWord文档中在此操作界面中,首先显示数据文件的一些信息,如数据文件的标题、总的样本个数、核苷酸替代的距离模型等然后是每个序列的名字,之后是序列之间的距离矩阵将此距离。





