NGS测序技术与分析流程图.ppt
42页第一代测序技术•Sanger测序1977年,桑格测定了第一个基因组序列,是噬菌体X174的,全长5375个碱基2021/3/111•Sanger法核心原理是:由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为:ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列2021/3/112新一代测序介绍•三大测序平台的前世今生Lynx MPSSSolexaABI SOLiD454Ion TorrentHelicosSMRTIllumina SolexaRoche 454Polony SeqABI Ion TorrentPacific Biosciences 2021/3/113Roche-454 •454公司可谓新一代测序技术的奠基人2005年底,454公司推出了革命性的基于焦磷酸测序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里程碑事件报道,开创了边合成边测序(sequencing-by-synthesis)的先河。
之后,454公司被罗氏诊断公司以1.55亿美元收购•454测序原理2021/3/114测序实验流程:•1、文库制备:根据样品的种类和实验目的,将基因组DNA/cDNA片段化处理至400-800bp间,经末端修复与特异性接头连接等修饰后变性处理回收单链的DNA(sstDNA);然后和两个44个碱基长的衔接子(adaptor)A、B进行平端连接A、B 衔接子各自含有20个碱基的PCR 引物序列、20个碱基的测序引物序列和4个碱基的对照序列(TACG),除此之外,B衔接子的5’端还标记有一个生物素基团,供后续的分离合适的测序模板使用2021/3/115测序实验流程:•2、Emulsion PCR:特定比例的单链DNA文库被固定在特别设计的DNA捕获磁珠上,使大部分磁珠磁珠携带了一个独特的单链DNA片断磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,每个独特的片断在自己的微反应器里进行独立的扩增,而不受其他的竞争性或者污染性序列的影响整个片段文库的扩增平行进行扩增后产生了几百万个相同的拷贝随后,乳液混合物被打破,扩增后仍结合在磁珠上的片段既可被回收纯化用于后续的测序实验;2021/3/116测序实验流程:•3、测序反应:携带DNA的珠子与其他反应物混合物,随后放入PTP板中进行后继的测序。
PTP孔的直径(29um)只能容纳一个珠子(20um)然后将PTP板放置在GS FLX中,测序开始每一个与模板链互补的核苷酸的添加都会产生化学发光的信号,并被CCD照相机所捕获;2021/3/117测序实验流程:•4、数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息,通过GS FLX系统提供两种不同的生物信息学工具对测序数据进行分析2021/3/118454 Pyrosequencing2021/3/1192021/3/1110454 的特点与主要应用•读长较长,400-600bp•通量较低,1Run 1M 序列,400-600Mb•相对成本较高•主要应用:de novo测序2021/3/1111Illumina solexa •Solexa 测序原理2021/3/1112Illumina solexa 2021/3/1113Illumina Solexa 桥式PCRdioldiol1st cycle denaturation1st cycle annealingdioldioln=35total1st cycle extensiondioldioldioldiol2nd cycle denaturation2nd cycle annealingdioldioldioldioldioldiol2nd cycle extension2021/3/1114Illumina Solexa Base Calling123789456T T T T T T T G T …T G C T A C G A T …2021/3/1115Solexa 的特点与主要应用•读长较短,100-150bp•通量高,25G每天,120-150G每Run•主要应用:RNA测序、表观遗传学研究2021/3/1116ABI SOLiD•SOLiDSequencing by Oligo Ligation/Detection•Oligo连接测序:通过连接酶连接,再对oligo上荧光基团进行检测SOLiD 5500xl2021/3/1117ABI SOLiD测序前期制备A 样品片段化磁珠连接B 乳化PCR3‘末端修饰C 磁珠富集转到测序玻片2021/3/1118ABI SOLiD测序原理2021/3/1119ABI SOLiD荧光结合和结果示例@SRR029969.1 VAB_5551_12_381_F3 length=35T11.0203.3.1113211010332111302330201+SRR029969.1 VAB_5551_12_381_F3 length=35!36!8/8:!:!462>@6=(<8>8.<;2:*9748078@SRR029969.2 VAB_5551_13_468_F3 length=35T202312302.3333130131131322113203131+SRR029969.2 VAB_5551_13_468_F3 length=35!9),4/3)&$!(&(573(96,'7&91>)43),(95,A. SOLiD Oligo荧光基团模式图B. SOLiD 测序结果示例(Color Space)2021/3/11202021/3/1121SOLiD 的特点与主要应用•读长较短,50-75bp•精度高,可达Q40•通量高, 20-30G每天,1Run 可达120G•主要应用:基因组重测序、SNP检测等2021/3/1122Ion torrentIon Torrent 测序原理2021/3/1123精度•Examples:•• 90%confidence(10%errorrate)=Q10•• 99%confidence(1%errorrate)=Q20•• 99.9%confidence(.1%errorrate)=Q302021/3/1124三种平台的技术差异平台平台454454SolexaSolexaSOLiDSOLiDPCR磁珠乳化PCR桥式PCR磁珠乳化PCR测序载体磁珠玻片玻片测序方式焦磷酸、荧光可逆终止物、荧光连接酶、荧光结果序列FastQFastQCSFastQ2021/3/1125三种平台的效能参数差异平平 台台读长读长通量通量周期周期精度精度Solexa HiSeq2000Single-end: 1 x 35 bpPaired-end: 2 x 50 bpPaired-end: 2 x 100 bp25 Gb/d~1.5d~4d~8d•50 bp 85%以上以上Q30•100 bp 80%以上以上Q30SOLiD 5500xlSingle-end: 75 bpPaired-end: 75 x 35 bpMate-pair: 60 x 60 bp20 – 30 Gb/d1d/ 1lane7d/ 12 lane7d/ 12 laneQ40454 GS FLX400 - 600 bp400 – 600 Mb/Run10hQ202021/3/1126转录组测序测序流程全转录组总RNApolyT富集mRNA去除rRNANon-coding RNA转录组mRNARNA片段化、纯化、检测产量连接两端接头序列逆转录生成cDNA选择适当长度cDNA进行扩增纯化扩增产物,评估产量上机进行高通量测序2021/3/1127转录组主要分析内容无参考序列无参考序列转录组分析内容转录组分析内容有参考序列有参考序列转录组分析内容转录组分析内容1 测序数据产量统计,数据成分和质量评估;2 Contig及Scaffold长度分布3 Unigene的长度分布和功能注释,GO分类,Pathway分析,差异表达分析4 蛋白功能预测与分类,差异表达基因GO富集和 Pathway富集分析。
1 基本数据统计,比对参考序列2 序列在基因组上在分布3 测序深度分析、随机性评估和基因差异表达分析4 新基因预测,基因可变剪接鉴定和基因融合鉴定等2021/3/1128小RNA测序2021/3/1129果蝇三种组织中MiRNA表达情况2021/3/1130MiRNA表达模式分析2021/3/1131新miRNA预测2021/3/1132miRNA编辑情况分析与统计2021/3/1133分析软件介绍•质量控制软件 (Quality Control)•定位软件 (Mapping the reads)•已知基因(差异)表达评估软件 (Differential Expression)•新基因鉴定软件 (New gene identification)•可视化展示软件 (Virsulization)•基因功能注释软件 (GO term or KEGG pathway analysis)2021/3/1134数据格式示例•Fastq 格式•Color Space 格式2021/3/1135Phred score2021/3/1136质量控制2021/3/1137利用galaxy进行原始数据处理https://main.g2.bx.psu.edu/2021/3/1138Galaxy History ' VGN FASTQ'https://main.g2.bx.psu.edu/u/jjv5/h/unnamed-history-12021/3/1139http://222.200.187.83/nongpost/linux_lecture/msg.php2021/3/1140知识回顾知识回顾Knowledge Knowledge ReviewReview2021/3/1141谢 谢!! 放映结束 感谢各位的批评指导!让我们共同进步2021/3/1142。





