
一代、二代、三代测序技术.pdf
5页一代、二代、三代测序技术 (2014-01-22 10:42:13) 转载 第一代测序技术-Sanger 链终止法 一代测序技术是 20 世纪 70 年代中期由 Fred Sanger 及其同事首先发明其基本原理是,聚丙烯酰胺凝胶电泳能够把长度只差一个核苷酸的单链 DNA 分子区分开来一代测序实验的起始材料是均一的单链 DNA 分子第一步是短寡聚核苷酸在每个分子的相同位置上退火,然后该寡聚核苷酸就充当引物来合成与模板互补的新的 DNA 链用双脱氧核苷酸作为链终止试剂(双脱氧核苷酸在脱氧核糖上没有聚合酶延伸链所需要的 3-OH 基团,所以可被用作链终止试剂) 通过聚合酶的引物延伸产生一系列大小不同的分子后再进行分离的方法 测序引物与单链 DNA 模板分子结合后,DNA 聚合酶用 dNTP 延伸引物延伸反应分四组进行,每一组分别用四种 ddNTP (双脱氧核苷酸) 中的一种来进行终止, 再用 PAGE 分析四组样品从得到的 PAGE 胶上可以读出我们需要的序列 第二代测序技术- 大规模平行测序 大规模平行测序平台(massively parallel DNA sequencing platform)的出现不仅令 DNA 测序费用降到了以前的百分之一, 还让基因组测序这项以前专属于大型测序中心的“特权”能够被众多研究人员分享。
新一代 DNA 测序技术有助于人们以更低廉的价格,更全面、更深入地分析基因组、 转录组及蛋白质之间交互作用组的各项数据 市面上出现了很多新一代测序仪产品,例如美国 Roche Applied Science 公司的 454 基因组测序仪、美国 Illumina 公司和英国Solexa technology 公司合作开发的 Illumina 测序仪、美国 Applied Biosystems 公司的 SOLiD 测序仪Illumina/Solexa Genome Analyzer 测序的基本原理是边合成边测序在 Sanger 等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的 dNTP,当 DNA 聚合酶合成互补链时,每添加一种 dNTP 就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测 DNA 的序列信息 以 Illumina 测序仪说明二代测序的一般流程,(1)文库制备,将 DNA 用雾化或超声波随机片段化成几百碱基或更短的小片段用聚合酶和外切核酸酶把 DNA 片段切成平末端,紧接着磷酸化并增加一个核苷酸黏性末端然后将 Illumina 测序接头与片段连接。
2)簇的创建,将模板分子加入芯片用于产生克隆簇和测序循环 芯片有 8 个纵向泳道的硅基片 每个泳道内芯片表面有无数的被固定的单链接头上述步骤得到的带接头的 DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用通过不断循环获得上百万条成簇分布的双链待测片段3)测序,分三步:DNA 聚合酶结合荧光可逆终止子,荧光标记簇成像,在下一个循环开始前将结合的核苷酸剪切并分解4)数据分析 第三代测序技术- 高通量、单分子测序 被称为第三代的测序的 He-licos 单分子测序仪,PacificBioscience 的 SMRT 技术和 Oxford Nanopore Technologies 公司正在研究的纳米孔单分子测序技术正向着高通量 低成本 长读取长度的方向发展 不同于第二代测序依赖于 DNA 模板与固体表面相结合然后边合成边测序,第三代分子测序,不需要进行 PCR 扩增1)Helico BioScience 单分子测序技术 该测序是基于边合成边测序的思想, 将待测序列随机打断成小分子片段并用末端转移酶在 3' 末端加上 poly(A),以及在 poly(A)的末端进行荧光标记和阻断,把这些小片段与带有poly(T)的平板杂交成像来获得已经杂交模板所处的位置,建立边合成边测序的位点 加入聚合酶和被 Cy3 荧光标记脱氧核苷酸进行 DNA 合成,每次只加入一种脱氧核苷酸,然后将未参与合成的 dNTP 和 DNA 聚合酶洗脱,直接对 Cy3 成像,观测模板位点上是否有荧光信号,然后化学裂解核苷酸上的燃料并释放 加入下一种脱氧核苷酸和聚合酶的混合物,进行下一轮反应。
2)Pacific BioscienceSMRTT 技术该测序也是基于边合成边测序的原理,这项技于使用了 Zero-ModeWaveguide(ZMW)(零级波导)测序的过程:被荧光标记磷酸集团的核苷酸在聚合酶活性位点上与模板链结合(每种脱氧核苷酸被不用颜色的染料标 记),被激发出荧光,在荧光脉冲结束后,被标记的磷酸集团被切割并释放,聚合酶转移到下一个位置,下一个脱氧核苷酸连接到位点上开始释放荧光脉冲,进行下一个循环3)Oxford Nanopore Technologies 的纳米孔单分子测序技术大多数纳米孔测序技术的基本原理是当 DNA 分子或者它的组成碱基从一个孔洞经过时而检测到被影响的电流或光信号OxfordNanopore 测序技术是以 α- 溶血素来构建生物纳米孔, 核酸外切酶依附在孔一侧的外表面, 一种合成的环糊精做为传感器共价结合到纳米孔的内表面 这个系统被镶嵌在一个脂双分子层内, 为了提供既符合碱基区分检测又满足外切酶活性的物理条件, 脂双分子层两侧为不同的盐浓度 在适合的电压下,核酸外切酶消化单链 DNA,单个碱基落入孔中,并与孔内的环糊精短暂的相互作用, 影响了流过纳米孔原本的电流, 腺嘌呤与胸腺嘧啶的电信号大小很相近,但胸腺嘧啶在环糊精停留是时间是其他核苷酸的 2-3 倍,所以每个碱基都因其产生电流干扰振幅是特有的而被区分开来。
第一代指双脱氧末端终止法,扩增后通过毛细管电泳读取序列,每次获取数据量少 第二代为高通量测序,采用微珠或高密度芯片边合成边测序,代表有 454,solexa,solid,高通量,可一次获得数 G 数据,相对与第三代,都仍然需要扩增的方法放大信号,扩增后再检测 第三代特点是单分子测序,多基于纳米科技,无需扩增,对单分链 DNA/RNA 直接用合成、降解、通过纳米孔等方式直接测序,核心特点是无需扩增所以成本更低 第二代DNA测序技术 编辑 本词条缺少信息栏,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧! 第二代测序技术的核心思想是边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端的标记来确定 DNA 的序列,现有的技术平台主要包括 Roche/454 FLX、Illumina/Solexa Genome Analyzer 和 Applied Biosystems SOLID system 目录 1. 1 概述 2. 2 基本原理 3. 3 操作流程 概述 编辑 DNA 测序(DNA sequencing)作为一种重要的实验技术,在生物学研究中有着广泛的应用。
早在 DNA 双螺旋结构(Watson and Crick,1953)被发现后不久就有人报道过 DNA 测序技术,但是当时的操作流程复杂,没能形成规模随后在 1977 年 Sanger 发明了具有里程碑意义的末端终止测序法,同年和发明了化学降解法Sanger 法因为既简便又快速,并经过后续的不断改良,成为了迄今为止 DNA 测序的主流然而随着科学的发展,传统的 Sanger 测序已经不能完全满足研究的需要, 对模式生物进行基因组重测序以及对一些非模式生物的基因组测序,都需要费用更低、通量更高、速度更快的测序技术,第二代测序技术(Next-generation sequencing)应运而生这三个技术平台各有优点,454 FLX 的测序片段比较长,高质量的读长(read)能达到 400bp;Solexa 测序性价比最高,不仅机器的售价比其他两种低,而且运行成本也低,在数据量相同的情况下,成本只有 454 测序的 1/10;SOLID测序的准确度高,原始碱基数据的准确度大于%,而在 15X 覆盖率时的准确度可以达到%,是目前第二代测序技术中准确度最高的 虽然第二代测序技术的工作一般都由专业的商业公司来完成,但是了解测序原理、操作流程等会对后续的数据分析有很重要的作用,下文将以Illumina/Solexa Genome Analyzer 测序为例,简述第二代测序技术的基本原理、操作流程等方面。
基本原理 编辑 Illumina/Solexa Genome Analyzer 测序的基本原理是边合成边测序在 Sanger 等测序方法的基础上,通过技术创新,用不同颜色的荧光标记四种不同的 dNTP,当 DNA 聚合酶合成互补链时,每添加一种 dNTP 就会释放出不同的荧光,根据捕捉的荧光信号并经过特定的计算机软件处理,从而获得待测 DNA 的序列信息 操作流程 编辑 1)测序文库的构建(Library Construction) 首先准备基因组(虽然测序公司要求样品量要达到 200ng,但是 Gnome Analyzer 系统所需的样品量可低至 100ng,能应用在很多样品有限的实验中),然后将 DNA 随机片段化成几百碱基或更短的小片段,并在两头加上特定的接头(Adaptor)如果是转录组测序,则文库的构建要相对麻烦些,RNA 片段化之后需反转成 cDNA,然后加上接头,或者先将 RNA反转成 cDNA,然后再片段化并加上接头片段的大小(Insert size)对于后面的数据分析有影响,可根据需要来选择对于基因组测序来说,通常会选择几种不同的 insert size,以便在组装(Assembly)的时候获得更多的信息。
2)锚定桥接(Surface Attachment and Bridge Amplification) Solexa 测序的反应在叫做 flow cell 的玻璃管中进行,flow cell 又被细分成 8 个 Lane,每个 Lane 的内表面有无数的被固定的单链接头 上述步骤得到的带接头的 DNA 片段变性成单链后与测序通道上的接头引物结合形成桥状结构,以供后续的预扩增使用 3)预扩增(Denaturation and Complete Amplification) 添加未标记的 dNTP 和普通 Taq 酶进行固相桥式 PCR 扩增, 单链桥型待测片段被扩增成为双链桥型片段 通过变性, 释放出互补的单链, 锚定到附近的固相表面 通过不断循环,将会在 Flow cell 的固相表面上获得上百万条成簇分布的双链待测片段 4)单碱基延伸测序(Single Base Extension and Sequencing) 在测序的 flow cell 中加入四种荧光标记的 dNTP 、DNA 聚合酶以及接头引物进行扩增,在每一个测序簇延伸互补链时,每加入一个被荧光标记的 dNTP 就能释放出相对应的荧光,测序仪通过捕获荧光信号, 并通过计算机软件将光信号转化为测序峰, 从而获得待测片段的序列信息。
从荧光信号获取待测片段的序列信息的过程叫做 Base Calling,Illumina 公司 Base Calling 所用的软件是 Illumina’s Genome Analyzer Sequencing Control Software and Pipeline Analysis Software读长会受到多个引起信号衰减的因素所影响,如荧光标记的不完全切割随着读长的增加,错误率也会随之上升 5)数据分析(Data Analyzing) 这一步严格来讲不能算作测序操作流程的一部分,但是只有通过这一步前面的工作才显得有意义 测序得到的原始数据是长度只有几十个碱基的序列, 要通过生物信息学工具将这些短的序列组装成长的 Contigs 甚至是整个基因组的框架,或者把这些序列比对到已有的基因组或者相近物种基因组序列上,并进一步分析得到有生物学意义的结果。












