
ContigExpress 序列拼接.doc
6页此名为ContigExpress的软件可用于做序列拼接,主要使用方法如下:1. 解压缩下载的压缩文件contig.zip文件,保证文件CExpress.exe,Gexudat.def在同一个目录下,打开Cexpress.exe应用程序,进入ContigExpress操作界面,如图1图12. 点 击菜单上的“Project”选择“Add Fragments”,一般我们发给您的是AB1文件,如果您有其它格式的文件,也可以选择,在这里我们选择AB1文件,以其为例,如图2图23. 选择您存放AB1文件(即我们Email给您的测序结果的彩图文件)的目录,选择文件类型为ALL FILES, 之后打开要拼接的AB1,从而添加进ContigExpress软件在此以A、B两个序列为例,如果有多个序列的也可以同时添加进入图34. 选中要拼接的序列,再选菜单 “Assemble”栏下的“Assemble Selected Fragments”命令,或用工具栏上的按钮,如图3若两个结果能够拼接起来的,会得到一个Assemble1下的contig1的结果,如图4图45. 双击contig1,打开拼接后的结果,选中菜单“VIEW”栏,进入VIEW OPTION,将SHOW ALIGNMENT AS 由 TEXT 改为 GRAPH.,点击OK 后得到结果如图5。
此时可能会因为两条序列的测序结果误差,会有不同的地方,在拼接图片框中的绿色竖杠就表示了这些不同的地方,如图所示接着可点击绿色竖杠找到有误差的地方,进行修改6. 在修改过程中,遇到有误差的地方,可以根据峰形来判断是多读还是漏读来进行修改,此时电脑认为是漏读碱基的地方会以点来表示,如图5,此处很明显是A序列上多读了一个G碱基,可将其删除注:因为软件本身的问题,只有在拼接过程中是正向的序列才能进行修改操作,若在反向上修改碱基,保存时会产生错误而直接关闭程序所以若要修改反向序列上的碱基,可先保存后,把原有的Assemble1的结果拆开,点序列图标上的“Name”,如图3,所选中的序列上的一个“name”横栏,使序列按Name的升降次序来排列,把要作为正向的序列放到要作为反向序列上面即可以此序列为例,将其改变方向后可实现反向拼接,如图6此时反向拼接中,电脑也会将整条序列自动进行反向互补若有多条序列只要让反向序列在正向序列上即可建议最好是修改一个碱基后就保存一下,然后拆开了再拼接,这样可以最大程度地避免误差图5图67. 全部修改完成后,所有的绿色竖杠就消失了,但电脑对那些个别碱基不同,即没有多读或漏读的现象,不会用绿色竖杠标出,这样也就是说,在整个序列中还有误差存在,所以这时我们就需要用到工具栏上的另一个按钮“find next ambiguous”,如图7,来找序列中因两条序列碱基不同而出现的N值,需要记住此时也只能在正链上进行修改。
如图,此处依据峰形可确定A链上的C应该为A,把它校正即可图78. 经过校正和修改之后,两条序列的重叠部分已经完全一致,序列已经拼通,可以把整个拼接结果保存下来,若想拷贝并保存整条序列,可以右击contig1选取“Select All”,再选“Copy sequence from … bp to … bp”,如图8然后打开可存放文本的应用程序,如记事本,把整个序列粘贴进去,保存即可。
