电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

mummer使用综述

6页
  • 卖家[上传人]:公****
  • 文档编号:477586064
  • 上传时间:2024-02-03
  • 文档格式:DOCX
  • 文档大小:17.53KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、MUMmer3.22 简介:DNA和核甘酸的快速比对软件包。基于suffix tree数据结构,快速、图形化、模块可用于其他软件、可进行大基因组比对、多对多基因组比对。二、MUMmer3.22中五个常用的包 :mummer、nucmer、 promer、run-mummer1 、run-mummer31、mummerMumme有效定位两序列的 maximal unique matches ,适用于产生准确匹配的列 表,可以用点图表示出来,或者用作双向比对的 anchors。mummer options . . . query file32一个reference 文件和至少一个query文件,Fast-A格式。大小写都可以, 这样DN用口蛋白质序列都可以比对。query最多32个文件,但每个文件中包含 的序列数没有限制。2、NUCmerNUCmer适用于亲缘关系较近的多核甘酸序列比对。首先找出给定长度的最 大准确匹配,然后将这些匹配结果聚簇形成大的不精确的比对区,最后从每个 匹配向外延伸将聚簇连接成单一的高打分pair-wise alignment 。NUCmer适用于定位高度保守的DN

      2、A序列区。通过增加 NUCmer的精确度,找到感兴趣的序列,独一无 二的序列(减少重复序列)。nucmer options FastA格式,不区分大小写,只有 ACTG(不区分大小写)DNA?母可以比 对。标准输出out.delta 文件(ASCII文件),通过show-aligns和showcoords 软件查看.delta 文件内容。show-aligns 展示序歹U, show-coords展示 对坐标的概括、相似度百分比等等。3、PROmerPROme用于核甘酸序列差别较大的比对,原理和NUCm讨目似,只不过在准确匹配前先将输入的序列翻译成六种氨基酸阅读框架。使PROme能识别在蛋白质序列水平上保守而在DNAK平不保守的区域,给出比NUCme高的相似度。PROme增加了敏感度导致高度相似序列的大量输出,所以,建议在输入的序列 差异较大时使用 o As with NUCmer, it is recommended to mask the input sequences to avoid the alignment of uninteresting sequence, or to

      3、change the uniqueness constraints (see the PROmesection) to reduce the number of repeat induced alignments. ?promer options FastA格式文件不区分大小写,只有有效的DNA字母可以翻译序列, 标准输出out.delta 文件(ASCII 文件),通过 show-aligns 和 show-c00rds 软件查 看.delta文件内容。4、run-mummer1 and run-mummer3三个步骤和NUCmer和PROmer一样,匹配、聚簇、延伸,但是他们可以处理任何输 入的序列,不只是核甘酸。run-mummer擅长比对相似性较高的 DNA序列,识别他们 的区别,适合于SNP和错误检测。run-mummer1用于没有重排的1:1的比对,runmummer 适合于有重排的 1 :多的比对。run-mummer1 -rrun-mummer3 FstaA格式不区分大小写,reference 文件只可以有一个单个序列,run-mummer 只准许有一个query序列,

      4、run-mummer3对query序列个数没有限制。run- mummer中-r参数用于反向匹配 query序列,而run-mummer3自动正反匹配。输出文件:.out , .gaps , .errorsgaps 和 .align 。三、使用案例主程序坐标序列数据过滤可视化1、Aligning two finished sequences两个连续的序列mummer -mum -b -c ref.fasta qry.fasta ref_qry.mums全局比对可视化mummerplot -postscript -prefix=ref_qry ref_qry.mums1.1. Highly similar sequences without rearrangements(高相似序歹U没有重排)两个序列相似度高,只有SNP?口小的缺失多态性。run-mummer1 ref.fasta qry.fasta ref_qry反向匹配(高相似度有重排)run-mummer1 ref.fasta qry.fasta ref_qry1.2. Highly similar sequences with

      5、rearrangements两序列相似度高,有重排、倒位、插入。为了准确定位SNP加-D参数。run-mummer3ref.fasta qry.fasta ref_qry1.3. Fairly similar sequences(中等相似序列)nucmer关注序列的相同run-mummer1和run-mummer我注两个序歹!J的区另U,点。nucmer对比对的限制较少,重排、倒位、重复都可以识别。nucmer -maxgap=500 -mincluster=100 -prefix=ref_qry ref.fasta qry.fastashow-coords -r ref_qry.delta ref_qry.coords坐标show-aligns ref_qry.delta refname qryname ref_qry.aligns序歹!J 生成文件量大,用 mummerplot可视化,用delta-filter 过滤数据。delta-filter -q -r ref_qry.delta ref_qry.filter数据过滤mummerplot ref_qry.filter -R r

      6、ef.fasta -Q qry.fasta数据可视化1.4. Fairly dissimilar sequences(差别较大的序列)DNA水平相似度很低,蛋白质序列保守时,用 promer。Promer在进行比对前将DNA 序列翻译成氨基酸。promer -prefix=ref_qry ref.fasta qry.fastashow-coords -r ref_qry.delta ref_qry.coords坐标 -k 参数可以减少输出的内容,只输出重要的内容过滤可视化序列show-aligns -r ref_qry.delta refname qryname ref_qry.aligns输出内容过多、如过滤和可视化:delta-filter -q -r ref_qry.delta ref_qry.filter mummerplot ref_qry.filter -R ref.fasta -Q qry.fasta2、Aligning two draft sequences没有完成的基因组,多倍体。nucmer和promer都可用于比对两组 contigs, scaffoldsor c

      7、hromosomes。序歹U差异不大用 nummer , 差异大用 promer。nucmer -prefix=ref_qry ref.fasta qry.fastashow-coords -rcl ref_qry.delta ref_qry.c00rdsshow-aligns ref_qry.delta refname qryname ref_qry.alignsmummerplot ref_qry.delta -R ref.fasta -Q qry.fasta -filter layout(可视化过滤输疝)3、 Mapping a draft sequence to a finished sequence(将草图序歹U拼成完整序歹U)nucmer和 promer。通过与 finished reference 比对,检测每个 query contig 的位置和 方向,完成草图序列的加工过程。通过检测保守区,提高草图序列的注释。4、SNP 检测 nucmernucmer -prefix=ref_qry ref.fasta qry.fastashow-snps -Clr ref_qry.

      8、delta ref_qry.snps nucmer -prefix=ref_qry ref.fasta qry.fasta除去repeatdelta-filter -r -q ref_qry.delta ref_qry.filter show-snps -Clr ref_qry.filter ref_qry.snps5、repeats 识另Unucmerrepeat 和 tandem repeat 识另U找不精确(inexact )的repeatnucmer -maxmatch -nosimplify -prefix=seq_seq seq.fasta seq.fastashow-coords -r seq_seq.delta seq_seq.coords找单个序列的准确重复(exact repeat )repeat-match -n 50 seq.fasta seq.repeats找长度大于50或更大的单个序列的准确串联重复(exact tandem repeat )exact-tandems seq.fasta 50 seq.tandems四、软件说明nucmer、promer、run-mummerl run-mummer3包括三个部分。第一部分识别两 个序列的最大准确匹配,第二部分将这些匹配聚簇形成组,当做成功比对的锚 点,第三部分将聚簇的匹配序列延伸形成最后有gap的比对。流程: maximal exact matching clustering alignment1、 Maximal exact matchingMUMm瞅件包的核心算法suffix tree基于最大准确匹配。Maximal exactmatching 通过 repeat-match 和 exact-tandems 可用于重复检测,通过 mummer 用于两个或多个序列比对。MUMmek部分程序用mumme的输出结果进行进一 步分析。2、clusteringLastz应用(两序列比对)Lastz :用于两条DNAff列的比对,自动调整打分参数。步骤:1、read sequence(s) from target file2、infer scoring parameters (if necessary )3、build a seed word position table for the

      《mummer使用综述》由会员公****分享,可在线阅读,更多相关《mummer使用综述》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.