
MALBAC单细胞全基因组测序详细解析.docx
5页单细胞全基因组测序一直是生物学家梦想得到的结果但是其中必须解决的矛盾:1. 线性扩增如果用全基因组PCR扩增,因为PCR的扩增偏向性(bias),再加上PCR过程 中较小的偏向性通过指数放大,其结果就会是严重的覆盖不均一, 导致在许多地方只有很低 的覆盖、甚至没有覆盖所以,保证模板被线性地扩增,是首要问题2. 全基因组覆盖常规的建库方法,因为补平、加A、接头连接效率的问题,起始DNA中有很大一部分会被浪费,没有形成有效文库分子(也就是两头都接好引物的 DNA片段)在单细胞测序中,这是不可接受的3. 高扩增效率单细胞中的每个基因位置理论上都只有 2个拷贝,而要从2个拷贝扩增到足够建立文库的DNA量,要经过许多次的扩增这就需要很高的扩增效率而一般的线性扩 增很难有好的扩增效率谢晓亮教授创新的 MALBAC 方法(multiple annealing andlooping-based amplification cycles), —举解决了上述3个问题,达到:1.线性扩增,2.近乎全覆盖,3.高扩增效率(高产量),并且最终可 以用于检测单细胞的 CNV原理:1.第—步nnmofGeronix Oi 科Quenchingat OGErien at 65Di wirKsolI|VM 亠爲Mating ar94'C f'A. 用5'端有27个统—序列,而 3'端是8个随机序列的引物,作为扩增引物。
用随机引物保证可以在模板链上的各处随机结合B. 0C淬火,再65C等温扩增,得到第一轮的复制的产物a. n个扩增产物(在图中标成蓝色),这些扩增产物都有在 5'端有一个统一的引物b. 1个原来的模板(在图中标成黑色)C. 用有前链移开功能的聚合酶(?29聚合酶)来进行扩增,这种酶的特点是会把酶前行方 向上的前链从原来的模板链上进行解链、 移开利用这种特点,可以让模板上的每个点在第—轮反应中,都有机会得到 n个拷贝D. 巧妙之处:a. 0 C淬火,在延伸开始之前,就把n个引物杂交到模板上b. ? 29聚合酶可以把前面的链给推开,结合前面的淬火步骤,一次复制出 n个扩增子2•第2轮起的m轮扩增Meh ng.mlWC nm+n - n■HHGenomic DNA■ HISemi-amplic on-半护増产物Full-amplicon4——扩増引瞬一序 列乍厂完整扩増产物与旷増引物统一底列互补的序列A. 每个循环a. 先OC淬火,再65C扩增b. 粘到第一轮所产生的扩增产物上的引物, 又会产生一轮扩增 其产物 5'端带有统一引物 序列, 3'端带有与统一引物序列,称为完整扩增产物c. 粘到原始模板上的引物,也产生一轮扩增。
但是其产物是只在 而在 5 '端带有统一引物序列, 3'端没有统一引物序列,称为半扩增产物d. 98 C 解链e. 58C保温,让完整产物的两端发生 链内杂交,复性后3'端的序列不再能与游离的互补引 物发生杂交,这就阻止了指数扩增B. 重复A步骤中从a~e的5个步骤,共5次经过m个循环后,得到:a. m* n2个“完整扩增产物”b. (m+1)* n 个“半扩增产物”c. 1 个原始模板C. 巧妙之处:a. 线性扩增i. 其巧妙之处在于,每个循环的最后,加了一步 58C 退火这一退火过程,让完整扩增产物的两端发生 链内杂交 这样 3'端的序列就 不能与新的游离引物发生杂交 ,也就不会引发 起始 于 3 '端的扩增,也就是 避免了“完整扩增产物”的自我指数扩增 ii. 如果发生以 8 个随机碱基为引物 3'末端的指数扩增, 3'末端的碱基序列不一致性就会导致扩增效率的Bias,再经过指数放大,就会变成明显的扩增效率 Biasiii. 现在,还是 8 个随机碱基的引物在模板上随机地找结合位点,所有位点的被扩增机会大 致均等iv. 完整产物的数量是m * n2,也就是说,扩增产物与m成正比,而不是与m2成正比,更不是与 2m成正比。
也就是说扩增产物与扩增的次数成线性关系这达成了单细胞测序所要求的:线性扩 b. 全基因组覆盖i. 再次利用 ?29 聚合酶的前链移开功能,在一个模板上扩增出多个扩增子这样从第 1 轮扩增开始, 每个模板就会得到多个扩增子 再加上以后 5 轮的扩增中, 原始模板都有机会再 次被 扩增出多个扩增子这样本保证每个原始模板都产生 n 个扩增子 建库时被漏掉一些扩增子,还是能保证大多数的基因组区域可以被建成库c. 高扩增效率i•在扩增中,所得到的 “完整扩增产物”的个数是 m *n2个这个“『”,还是利用了 ?29聚合酶的“前链移开功能“,保证了扩增有较高的效率可以得到较多的扩增产物,以供下 面的实验 之用结果1. Lorenz 曲线0.9spe① 0.8ssouo 0.6OBJJ 0.5① 0.4AQR-nluno0.30.2s己己工是弱于f • i121bL11JIt>IFt14JO21UXrcell 1MALEUM!IRMilidih M tw -AAiKhi* i (bAJ..V 4 2 0 Bulk——MALBAC—MDA Perfect Uniformity0L0 0.2 0.4 0.6 0+8Cumulative fraction of genome可以从上面的Lorenz曲线中看出来,MALBAC方法的覆盖均一性明显好于MDA方法,但还 大批量细胞的测序结果。
蓝箭头和绿箭头,分别指出MALBAC方法和MDA方法没有测到序列部分占全基因组的比例2. CNV3. A、B、C、D中的绿线是按Markov模型估算出来的CNV数4. A、B、C,分别是3个单细胞MALBAC方法测序后的覆盖率5. D是大量细胞测序后的覆盖率6. E是MDA方法测序后的覆盖率7. 测序的深度都是平均 25倍 参考文献:Che ngha ng Zo ng1, Sijia Lu1, Alec R. Chapma n, X. Su nney Xie. Ge no me-Wide Detecti on of Single-Nucleotide and Copy-Number Variations of a Single Human Cell. Science 21 December 2012:Vol. 338 no. 6114 pp. 1622-1626Rubicon Genomics公司推出了商业化的单细胞测序试剂盒, Rubicon并没有公布其技术细节,但是根据其公开的技术材料,基本与 MALBAC技术相近:都是通过扩增产物的末端自封闭来抑制指数扩增 *通过数轮线性扩增得到大量的扩增产物。












