
物理图谱与测序.ppt
169页第三章DNA物理图谱的构建及序列测定,.,物理图谱(physical map),物理图/限制性图谱(restriction map)是各种限制性内切酶切点在某一DNA分子或DNA片段上的排列,由于各酶切点之间的距离是以碱基对(kbp mbp)表示的,所以可计算出二切点间的绝对距离,因此限制图也称物理图物理图谱的构建是基因组研究的重要组成部分质粒pBR322的限制图,.,一、限制性核酸内切酶(restriction endonuclease),细菌核酸内切酶 识别、剪切特殊双链DNA序列 用途:DNA物理图谱构建、DNA序列分析、基因分离、基因定位、DNA重组,.,1.细菌的 修饰作用和限制性核酸内切酶的发现,20世纪50年代,Luria Asakawa et al. 1997) Not 识别序列,位点十分稀少重组子通过 Not 消化后,可以得到完整的插入片段 Sp6 、 T7 是来源于噬菌体的启动子,用于插入片段末端测序BAC 载体空载时大小约 7.5kb ,在大肠杆菌中以质粒的形式复制,具有一个氯霉素抗性基因 外源基因组 DNA 片段可以通过酶切、连接克隆到 BAC 载体多克隆位点上,通过电穿孔的方法将连接产物导入大肠杆菌重组缺陷型菌株。
装载外源 DNA 后的重组质粒通过氯霉素抗性和 Lac Z 基因的 互补筛选BAC载体的优点,以大肠杆菌为宿主,电转化,效率高 BAC载体以超螺旋形式存在于大肠杆菌,提取方便; 复制子源自F质粒,遗传稳定,嵌合、重组少; DNA单拷贝存在,适于传统菌落培养,可采用菌落原位杂交筛选目地基因; 克隆位点两侧有T7和SP6启动子,可制备RNA探针或对插入片段测序菌落原位杂交筛选目地基因,.,E.coli RNA聚合酶的结构,E.coli只有一种RNA聚合酶 全酶(holoenzyme) : 2 ( 450 kD ) 核心酶(core enzyme): 2,.,,大肠杆菌RNA聚合酶全酶识别并结合于启动子,.,.,.,三、基因组研究的有关图谱,遗传图谱 物理图谱 基因图谱 序列图谱,.,.,.,1.遗传图谱(genetic map)/遗传连锁图/连锁图谱(linkage map),以具有遗传多态性(在一个遗传位点上具一个以上的等位基因,在群体中的出现频率皆高于1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为1cM)为图距的基因组图。
6000多个遗传标记将人的基因组分成6000多个区域,使连锁分析法可以找到某一致病或表现型的基因与某一标记邻近(紧密连锁)而定位是定位疾病基因和分析基因是个关键遗传图基因定位,.,遗传图谱的 DNA标记,第1代标记:经典的遗传标记,以蛋白质或免疫学多态性位点为标记标记位点与所研究性状间连锁关系 ABO血型位点标记,HLA(人类白细胞抗原)位点标记已知多态性蛋白位点少,技术复杂、准确性差 70年代,限制性片段长度多态性(RFLP):群体中不同个体DNA序列仅有约1%差异DNA多态性位点,酶切位点的变异(RFLP)限制性片段长度多态性,.,.,第2代标记,80年代,微卫星中心(minisatellite core)、可变串联重复VNTR(variable number of tandem repeats)提供不同长度重复片段(612个核苷酸 1989年微卫星标记(microsatellite marker)系统的发现和建立,结合PCR技术简单序列长度多态性(simple sequence length polymorphism,SSLP) ,扩增片段长度多态性 (Amplified Fragment Length Polymorphism,AFLP)等 。
微卫星(microsatellite)标记,微卫星又称为简单重复序列(simple sequence repeat,SSR) 这种重复序列的重复单位很短,常常只有2个、3个或4个核苷酸 如一条染色体TCTGAGAGAGACGC 另一染色TCTGAGAGAGAGAGAGAGACGC,就构成了多态性第3代标记,90年代,单核苷酸多态性(single nucleotide polymorphism,SNP):指染色体基因组水平上由单个核苷酸变异引起的DNA序列多态性,具有分布广、密度高(人类基因组中每1000个核苷酸就有一个SNP )、多态性丰富等特点果蝇连锁图,.,14号染色体遗传图谱上家系定位示意图,.,7号染色体上已定位的遗传病,.,疾病基因的确定,.,2. 物理图谱,基因组DNA限制性酶切片段排列顺序图 酶切片段在DNA链上的定位 基因组中基因间顺序显性化 比遗传图谱分辨率更高 是从遗传图到序列图的中间图谱,.,.,核苷酸序列不同的DNA,经酶切后产生不同长度的DNA片段,由此构成独特的酶切图谱3. 序列图谱,包括制备DNA片段化及碱基分析、DNA信息翻译的多阶段的过程通过测序得到基因组的序列图谱。
大规模测序基本策略:逐个克隆法:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)全基因组鸟枪法:在一定作图信息基础上,不经大片段连续克隆系的构建,直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)4.基因图谱,在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱鉴别出全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物mRNA反追到染色体的位置 能有效地反应在正常或受控条件中表达的全基因组时空图 可以了解某一基因在不同时间不同组织、不同水平的表达;也可以了解一种组织中不同时间、不同基因中不同水平的表达,还可以了解某一特定时间、不同组织中的不同基因不同水平的表达对基因转录表达产物mRNA互补的cDNA(其片段称为表达序列标签,EST)进行大规模测序是序列标签位点的主要来源,并以此构建人类基因组转录图(基因图)A portion of the E.coli chromosome showing genes and operons. A dot indicates the promoter for each gene or operon. Arrows and color indicate the direction of transcribtion: dark blue genes are transcribed left to right, light blue are transcribed right to left.Overlapping gene are shown in green.,.,四、构建DNA物理图谱的方法,完整的物理图谱包括:人类基因组的不同载体DNA克隆片段重叠群图;大片段限制性内切酶切点图;DNA片段或异DNA序列(sequence tags site,STS)的路标图;基因组中广泛存在的特征型序列(如CpG序列、Alu序列,isochore)等的标记图。
基本原理是把庞大的无从下手的DNA先“敲碎”,再拼接以Mb、kb、bp作为图距,以DNA探针的STS(sequence tags site)序列为路标主要方法,限制性核酸内切酶降解法 部分变性法 DNA聚合酶法 杂交电镜法(环形成法) 末端标记法,.,1.限制性核酸内切酶降解法,部分酶解法 交叉酶解法,.,部分酶解法的2个基本步骤,完全降解:限制性内切酶将放射性标记DNA完全降解,经凝胶电泳分离后进行自显影,图谱显示组成该DNA链的酶切片段的数目和大小 部分降解:末端标记DNA一条链,以相同酶部分降解(控制反应条件使酶量、温度、时间DNA链上该酶的切口随机断裂),电泳分离及自显影比较2个自显影图谱,根据片段大小及彼此间的差异排出酶切片段在DNA链上的位置片那段重叠一线性DNA片断长18.1kb,EcoRI完全消化后电泳,得8个片段,部分消化产生15个片断完全消化片断: A (4.6) , B (4.0), C (3.3), D (2.5), E (2.0), F (1.0), G (0.5), H (0.2) 部分消化片断: 6.6 6.5 5.3 4.6 4.2 4.0 3.8 3.5 3.3 2.5 2.0 1.0 0.7 0.5 0.2,.,部分消化大片断是完全消化小片断之和,可推测: 6.6 = 2+4.6(E + A); 6.5 = 2.5+4.0 (D + B); 5.3 = 2+3.3(E + C); 3.8 = 0.5+3.3(G + C); 0.7 = 0.2+0.5(G+H); 4.2 = 0.2+4 (B+H) 或 4.2 =0.2+0.5+1.0+2.5(H + F + G + D); 3.5 =1.02.5 (F + D) 或 3.5 = 0.2+3.3(H + C) 或 3.5 = 0.5+1.0+2.0(G + F + E),A E C G H F D B,4.6 2.0 3.3 2.5 4.0,0.5 0.2 1.0,,,,,EcoR I 在此DNA片段上的酶切图谱,.,交叉酶解法,.,DNA片段总长 3kb EcoR: 1.7,0.9,0.4 Hpa: 1.6,1.4 EcoR+ Hpa:1.2 , 0.9 , 0.5 , 0.4,Hpa一个切点 EcoR1.7 kb片段不在末端-无0.2、0.1片段 EcoR 0.9和0.4 kb都在末端,,,.,2.部分变性法,DNA分子各区域AT含量不同,部分变性后,富含AT区出现电镜下可见的环状结构。
比较限制酶切DNA部分变性及全分子部分变性结果,确定酶切位点顺序3.末端标记法,待测DNA片段的5或3端先用32P标记; 用某限制性内切酶部分酶解; 电泳和放射自显影分析这一组酶解片段的长度 各相邻片段的长度之差就是二个相邻切点之间的距离,也即它们之间片段的大小 以足够数量的限制性内切酶分别进行分析,对DNA片段作出比较详细的物理图谱G F E D C B A,,,,*,,,A-G,,,*,,,A-F,,,,,,A-E,A-D,*,,A-C,,,,*,,A-B,,,*,,A,,*,,,,末端标记,,,,,,,,,,,,,,,,,,,,,,,,*,,,,,电泳凝胶上DNA片断的鉴定,.,人类部分染色体物理图谱,.,The E.coli genome,.,五、核酸序列分析,.,DNA一级结构测定 (DNA sequencing),DNA的一级结构: 多聚脱氧核苷酸链中脱氧核苷酸的排列顺序碱基序列,.,DNA碱基顺序测定的主要方法,1975年,Sanger 加减法 1977年,Sanger 双脱氧终止法 1977年,Maxam & Gilbert 化学断裂法,.,1.双脱氧法(dideoxy method)或末端终止法(chain termination),DNA sequencing with chain-terminating inhibitors. Sanger, F. , Nicklen, S. & Coulson, A.R. (1977).Proceedings of the National Academy of Sciences, USA, 74, 5463-7. a second Nobel Prize in Chemistry in 1980,.,DNA的生物合成,.,参与DNA复制的主要物质 底物: dATP, dGTP, dCTP, dTTP(dNTP) 聚合酶: DNA聚合酶(DNA polymerase) 模板(template): 解开成单链的DNA母链 引物(primer): 互补于模板链的。
