
第四章基因与基因组的结构2讲课文档.ppt
50页第四章基因与基因组的结构第一页,共五十页优选第四章基因与基因组的结构2 2第二页,共五十页一、基因概念及其发展一、基因概念及其发展(一)经典遗传学关于基因的串珠理论(一)经典遗传学关于基因的串珠理论 经典遗传学认为基因是遗传信息结构和功能的基本单位;即基因是最小的突变单位、重组单位和功能单位;基因位于染色体上,从结构和功能来看,它们以线性的形式相互连接(串珠理论,the beads on a string theory)二)近代基因概念(二)近代基因概念 上述“三位一体”的基因概念在上世纪四十年代以前占统治地位Benzer在上世纪50年代初通过噬菌体重组实验,发现突变和重组可以发生在同一个基因内的不同亚单元中,从而对以上结果提出了挑战研究表明:基因可被分为更小的单位,串珠理论必须修正Benzer提出了突变子(muton),重组子(recon)和顺反子(cistron)来分别定义突变、重组和功能作为不可分割单位3第三页,共五十页1顺反子(顺反子(Cistron)一个顺反子是一段遗传区域,在这一遗传区域中的突变位点之间没有互补作用1)顺反子的概念来自顺反测验顺反测验(cis-trans test):它是用于说明在同一染色体上(顺式)或相对染色体上(反式)排列的突变位点之间的互补试验。
顺式试验实际是对照,如果两个突变均在同一个基因组中,那么另一个基因组的两个基因座均为野生型,其产物为正常的基因产物,细胞表现出野生表型;反式试验才是真正的互补试验,可以确定功能确定功能单位的边界单位的边界,如果反式排列时有互补作用,说明两个突变位点处于不同的顺反子中,如不能互补,说明它们属于同一顺反子如果两个突变在同一个基因中,那么它们以反式构型出现在细胞中时,每一基因组都携带有这一基因的突变体拷贝,因而在细胞中不能产生具有功能的产物,即不出现互补如果突变位于不同基因中,当它们以反式构型出现时,那么每个基因组均可补偿另一个基因组缺少的正常产物当细胞具有所有基因产物时,表现为野生型 4第四页,共五十页 顺式试验反式试验突变位点位于同一顺反子中突变位点于不同顺反子中A B A B A B A B+ + +(2)不能互补的突变必然影响的是同一功能单位,能够互补的突变必定影响不同的功能单位,通过顺反试验发现的遗传功能单位称为顺反子3)基因是一个顺反子,它是一个功能单位一个顺反子内存在许多突变位点,即存在许多突变子;一个顺反子内可以发生交换出现重组,因此也可以有许多重组子 5第五页,共五十页2突变子(突变子(muton)突变子是基因内部变化后产生突变表型的最小单位,顺反子内可能发生突变的最小单位,即核苷酸对。
3重组子(重组子(recon) 重组子是基因内部不能由重组而分开的基本单位,可进行重组的最小遗传单位,可小到只有单个核苷酸对三)基因与顺反子的关系(三)基因与顺反子的关系 1在简单基因组中基因与顺反子等价在简单基因组中基因与顺反子等价 (1)在细菌中:基因是编码区(多顺反子)2)在真核细胞中:基因是转录的单位(单顺反子 ) 2复杂基因组中基因与顺反子不等价复杂基因组中基因与顺反子不等价 在高等真核细胞的基因组中,基因和产物之间的关系较为复杂1)在反式剪接与RNA编辑的中,单个多肽链的合成需要多个基因表达,每个基因都是同一功能单位的部分并构成单个顺反子 (2)一个基因通过多种剪接方式或其他选择性信息的利用方式产生多种产物 6第六页,共五十页7第七页,共五十页3重重叠叠基基因因(overlapping genes):也称为嵌套基因(nested gene),指是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列成为两个或两个以上基因的组成部分重叠基因有多种重叠方式例如,大基因内包含小基因;前后两个基因首尾重叠一个或两个核苷酸;几个基因的重叠,几个基因有一段核苷酸序列重叠在一起,等等。
重叠基因中不仅有编码序列也有调控序列,说明基因的重叠不仅是为了节约碱基,能经济和有效地利用DNA遗传信息量,更重要的可能是参与对基因的调控 8第八页,共五十页三、基因的结构(三、基因的结构(三、基因的结构(三、基因的结构(Gene organizationGene organization)1. 基因的数量基因的数量 基因的功能取决于DNA的一级结构,一个DNA分子能携带多少基因呢?若以10001500bp编码1个基因计算,猿猴病毒SV40基因组DNA有5000bp,可编码5种基因人类基因组DNA含3 109 bp,理论上可编码200万以上的基因,因存在内含子而每个基因可长达50008000bp,少数可达20000bp这样推算人类基因组相当于4060万个基因;而现在知道人类基因组所含基因只有22.5万个,只占全部基因组的3%,其余90%多属于非编码区,其功能仍不清楚2. 编码区和非编码区编码区和非编码区 一个基因组的核酸可分为编码区和非编码区两类序列1)编码区为mRNA、rRNA、tRNA以及其他各种RNA编码2)非编码区又可分为信号序列和非信号序列两类信号序列包括:复制起点、增强子、启动子、终止子及一切由调节蛋白识别和结合的序列;非信号序列是指间隔区。
9第九页,共五十页3. 一个完整基因的结构一个完整基因的结构一个完整的结构基因常具备以下几个组成部分:启动子、编码序列、终止子,以及基因在启动子的上游或其它区域的调控序列编码区,又称为开放阅读框()编码区,又称为开放阅读框(ORF):):可以翻译成蛋白质的DNA区域,在细菌中,即为一个基因;在真核细胞中,编码区可以被内含子隔断转转录录单单位位(转转录录区区域域):可以转录为RNA的一段DNA区域在真核细胞中即为一个基因;在细菌中可能包含多个基因非翻译区或非编码区()非翻译区或非编码区(UTR,NCR):):指转录单位中不能翻译成蛋白的部分又可分为5 UTR和3UTR,这些序列往往具有调控功能;5UTR控制核糖体的结合,还可能促进衰减子控制;而3UTR在mRNA的稳定性中起重要作用4)基因间隔区)基因间隔区 :间隔区并非不含有信息,这信息不表现为核苷酸的顺序,而表现为序列的长度如MS2外壳蛋白结构基因上游的非编码序列不得少于30nt,否则,翻译效率要降低10倍;真核基因的内含子含有重要信息,如剪接位点等都有严格要求;果蝇乙醇脱氢酶基因Adh有两个内含子,如缺失其中之一或两个都缺失,则转录水平下降5倍。
10第十页,共五十页一个完整真核生物基因的结构包括:一个完整真核生物基因的结构包括: (1)启动子()启动子(promoter):):是RNA聚合酶特异性识别和结合的DNA序列,位于结构基因转录起始点的上游-25bp处,本身不被转录;启动子必须与转录因子结合才能被RNA聚合酶识别与结合;具有TATA盒2)上游启动子元件()上游启动子元件(upstream promoter elements):TATA盒上游的一些特定的DNA序列;反式作用因子能与这些元件结合调控基因的转录效率;上游启动子元件包括CAAT盒( GCNCAATCT )、CACA盒( CCGCC)及GC 盒 ( GCCACACCC )3)反应元件()反应元件(response element):能介导基因对细胞外的某种信号产生反应的DNA序列,称为反应元件如糖皮质、激素反应元件4)增强子()增强子(enhancer):指能使和它连锁的基因转录频率明显增加的DNA序列其中含有多个能被反式作用因子识别与结合的顺式作用元件,能增强邻近基因的转录5)沉默子()沉默子(silencer):又称负增强子,负调控序列6)加尾信号:)加尾信号:结构基因的最后一个外显子中有一个保守序列AATAAA与下游一段GT丰富区或T丰富区共同构成polyA加尾信号;与RNA聚合酶结合的延长因子能识别这种结构并与之结合,然后在AAUAAA下游1030个碱基的部位切断RNA并加上polyA尾巴。
11第十一页,共五十页4 4基因命名法基因命名法基因命名法基因命名法 基因的命名一般根据种属习惯来命名常用斜体表示基因的名称,等位基因及其基因型,或在必要时表示基因转录而成的mRNA,而蛋白产物和表型用正体来表示但是在研究不同生物的同一遗传机制时,往往会产生一些混淆在许多种属中,基因由包括几个字母和数字的符号来表示,一些种属命名惯例(如果蝇、大肠杆菌)认为使用小写字母表示隐性突变,而用第一个字母大写来表示显性突变在其他一些种属包括人的基因命名中,基因全由大写字母表示现在,通过大规模的测序方法,更多的基因不断被鉴定,因而十分需要一个统一的命名方法1212第十二页,共五十页大大肠肠杆杆菌菌和和其其他他细细菌菌:用三个小写字母表示一个操纵子,接着的大写字母表示不同基因座例如:lac操纵子;基因座lacZ,lacY,lacA;蛋白质LacZ,LacY,LacA酵酵母母:用三个字母表明基因功能,数字表示不同的基因座啤酒酵母基因GAL4,CDC28;蛋白质GAL4,CDC28;非洲粟酒酵母基因gal4,cdc2;蛋白质Gal4,Cdc2线线虫虫:用三个小写字母表示突变表型,如存在不只一个基因座,用连字符后接数字表示。
例如:基因 unc-86,ced-9;蛋白质UNC-86,CED-9果果蝇蝇:来自突变表型的描述可以用1-4个字母代表例如基因white(w),tailless(tll);蛋白质White,Tailless植植物物:虽然没有适用于所有植物的惯用法,但大多数用1-3个小写字母表示Arabidopsis基 因 用 果 蝇 的 方 法 命 名 但 使 用 大 写 字 母 , 例 如 基 因AGAMOUS(AG),蛋白AGAMOUS脊脊椎椎动动物物:一般以描述基因功能的1-4个小写字母和数字表示其基因功能例如基因sey,myc,蛋白Sey,Myc人人类类:方法如脊椎动物但需大写例如基因MYC、ENO1,蛋白MYC、ENO113第十三页,共五十页5. 5. 基因的突变基因的突变基因的突变基因的突变 基因突变是指出现在单个基因内部任何可遗传的改变,又称为点突变基因突变可以自然发生,也可通过理化因素诱发主要包括两种情况:一是碱基替换:一个碱基对被另一碱基对替换,包括转换和颠换二是移码突变:增加或减少一个或几个碱基对 基因突变与氨基酸顺序的关系:基因突变与氨基酸顺序的关系:基因突变与氨基酸顺序的关系:基因突变与氨基酸顺序的关系:(1)同义突变(same sense mutation):密码子发生改变,但所编码的氨基酸不变。
2)错义突变(missense mutation):DNA中碱基对替换,使mRNA的某一密码子改变,由它所编码的氨基酸不同很多错义突变造成蛋白质的部分或完全失活,从而表现出突变性状3)无义突变(nonsense mutation):碱基替换改变了mRNA上的一个密码子,成为3个密码子UAG,UAA和UGA中的一个时,就出现无义突变14第十四页,共五十页第二节、基因组及其结构基因组基因组(genome) :是指含有一个生物体生长、发育和繁殖所需要的全部遗传信息的整套核酸核基因组是单倍体细胞核内的全部 DNA分子;线粒体基因组和叶绿体基因组分别是指一个线粒体和叶绿体所包含的全部DNA分子基因组中不同的区域具有不同的功能,有编码区和非编码区,有些区域的功能尚不清楚功能基因组:功能基因组:是指表达一定功能的全部基因所组成的DNA序列,包括编码基因和调控基因基因组结构:基因组结构:是指不同功能区域在整个DNA分子中的分布情况C值值 :是指单倍基因组DNA含量(haploid DNA content,C值)不同的生物体,其基因组的大小和复杂程度各不相同进化程度越高的生物体一般其基因组越大也越复杂,但不尽然,如肺鱼的C值居然比人高10多倍;在亲缘关系相近的物种间,C值仍然相差很大,两。












