
生物化学与分子生物学课件13真核基因与基因组.ppt
36页目录目录真核基因与基因组真核基因与基因组 第十三章第十三章Eukaryote Gene and Genome目录目录基因包括基因包括编码序列编码序列(外显子)、(外显子)、调控序列调控序列和和间隔间隔序列序列(内含子)(内含子)基因(基因(genegene):):编码蛋白质或编码蛋白质或RNA等具有特等具有特定功能产物的、负载遗传信息的基本单位除定功能产物的、负载遗传信息的基本单位除了某些以了某些以RNARNA为基因组的为基因组的RNARNA病毒外,基因通病毒外,基因通常是指染色体或基因组的一段常是指染色体或基因组的一段DNADNA序列目录目录基因组(基因组(genome):):一个生物体内所有遗传一个生物体内所有遗传信息的总和信息的总和人类基因组包含了细胞人类基因组包含了细胞核染色体核染色体DNA(常(常染色体和性染色体)及染色体和性染色体)及线粒体线粒体DNA所携带的所所携带的所有遗传物质有遗传物质 目录目录真核基因的结构与功能真核基因的结构与功能 第一节第一节The Structure and Function of Eukaryote Gene目录目录利用碱基的不同排列利用碱基的不同排列荷载遗传信息荷载遗传信息。
复制并传递遗传信息复制并传递遗传信息给子代细胞,在这一过程给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变中为适应环境变化,可能会发生基因突变 作为作为基因表达的模板基因表达的模板,使其所携带的遗传信息,使其所携带的遗传信息通过各种通过各种RNA和蛋白质在细胞内有序合成而表和蛋白质在细胞内有序合成而表现出来 n 基因的功能基因的功能目录目录n 与基因功能相关的结构与基因功能相关的结构编码区序列(编码区序列(coding region sequence )非编码序列(非编码序列(non-coding sequence)基因表达需要的调控区(基因表达需要的调控区(regulatory region)序列,)序列,包括启动子(包括启动子(promoter)、增强子()、增强子(enhancer)等在细胞内表达为蛋白质或功能在细胞内表达为蛋白质或功能RNA的的DNA序列序列目录目录一、真核基因的基本结构一、真核基因的基本结构编码蛋白质或编码蛋白质或RNA的的编码序列编码序列非编码序列非编码序列,包括编码区两侧的调控序列和,包括编码区两侧的调控序列和编码序列间的间隔序列编码序列间的间隔序列。
目录目录真核基因结构不连续,为断裂基因(真核基因结构不连续,为断裂基因(split gene)真核基因结构真核基因结构外显子外显子(exon);在基因序列中,出现在成熟);在基因序列中,出现在成熟mRNA分子分子上的序列上的序列内含子内含子(intron):外显子之间、与):外显子之间、与mRNA剪接过程中被剪接过程中被删除部分相对应的间隔序列删除部分相对应的间隔序列目录目录真核生物绝大部分编码蛋白质的基因都有内含子真核生物绝大部分编码蛋白质的基因都有内含子编码编码rRNA和一些和一些tRNA的基因也都有内含子的基因也都有内含子外显子与内含子接头处有一段高度保守的序列,外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中这一共有序列是真核基因中RNA剪接的识别信号剪接的识别信号目录目录基因的基因的5 端称之为上游,端称之为上游,3 端称为下游端称为下游基因序列中开始基因序列中开始RNA链合成的第一个核苷酸所链合成的第一个核苷酸所对应的碱基记为对应的碱基记为+1,此碱基上游的序列记为负,此碱基上游的序列记为负数,下游的序列记为正数数,下游的序列记为正数目录目录二、基因编码区编码多肽链和特定的二、基因编码区编码多肽链和特定的RNA分子分子 基因编码区中的基因编码区中的DNA碱基序列碱基序列决定特定的成熟决定特定的成熟RNA分分子的序列,即子的序列,即DNA的一级结构决定着其转录产物的一级结构决定着其转录产物RNA分分子的一级结构。
子的一级结构目录目录三、调控序列参与真核基因表达调控三、调控序列参与真核基因表达调控 位于基因转录区前后,对基因表达起调控作用的区位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的域,因其是紧邻的DNA序列,又称旁侧序列序列,又称旁侧序列基因的调控区(顺式作用元件)基因的调控区(顺式作用元件)目录目录转录起始点转录起始点TATA盒盒CAAT盒盒GC盒盒增强子增强子AATAAA剪接加尾剪接加尾转录终止点转录终止点修饰点修饰点外显子外显子翻译起始点翻译起始点内内含含子子 OCT-1 OCT-1:ATTTGCAT八聚体八聚体+1结构基因结构基因启动子启动子上游启动子元件上游启动子元件目录目录启动子启动子上游调控元件上游调控元件增强子增强子加尾信号加尾信号细胞信号反应元件细胞信号反应元件顺式作用元件顺式作用元件目录目录1. 1. 启动子提供转录起始信号启动子提供转录起始信号 启动子启动子是是DNA分子上能够介导分子上能够介导RNA聚合酶聚合酶结合并形成转录起始复合体的序列结合并形成转录起始复合体的序列多数启动子位于真核细胞基因转录起点的上游,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。
启动子本身通常不被转录少数启动子(如编码少数启动子(如编码tRNA基因的启动子)位于基因的启动子)位于转录起始点的下游,这些转录起始点的下游,这些DNA序列可以被转录序列可以被转录目录目录2. 增强子增强邻近基因的转录增强子增强邻近基因的转录增强子增强子是增强真核基因启动子工作效率的顺是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平决定着每一个基因在细胞内的表达水平目录目录沉沉默默子子(silencer)是是抑抑制制基基因因转转录录的的特特定定DNA序序列列,当当其其结结合合一一些些反反式式作作用用因因子子时时对对基基因的转录起阻遏作用,使基因沉默因的转录起阻遏作用,使基因沉默3. 沉默子是负调节元件沉默子是负调节元件目录目录真核基因组的结构与功能真核基因组的结构与功能 第二节第二节The Structure and Function of Eukaryote Genome目录目录基因组基因组:细胞或生物体的一套完整单倍体:细胞或生物体的一套完整单倍体遗传物质的总和遗传物质的总和目录目录一、真核基因组具有独特的结构一、真核基因组具有独特的结构基因的编码序列所基因的编码序列所占比例占比例远远小小于非编码序列。
于非编码序列高等真核生物基因组含有高等真核生物基因组含有大量的重复序列大量的重复序列,真核基因组中存在多真核基因组中存在多基因家族和假基因基因家族和假基因大多基因具有大多基因具有可变剪接可变剪接,80%的可变剪接会的可变剪接会使蛋白质的序列发生改变使蛋白质的序列发生改变结构特点:结构特点:目录目录高度重复序列高度重复序列(highly repetitive sequence)中度重复序列中度重复序列(moderately repetitive sequence)单拷贝序列单拷贝序列(single copy sequence)或低度重复序列或低度重复序列二、真核基因组中存在大量重复序列二、真核基因组中存在大量重复序列 目录目录(一)高度重复序列(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般由主要存在于染色体的着丝粒区域,重复单位一般由210 bp组成,成串排列,在人基因组中约占组成,成串排列,在人基因组中约占5%6%重复频率可达重复频率可达106以上,不编码蛋白质或以上,不编码蛋白质或RNA反向重复序列反向重复序列(inverted repeat sequence)卫星卫星DNA(satellite DNA)两个相同顺序的互补拷贝在同一两个相同顺序的互补拷贝在同一DNA链上反向排列而链上反向排列而成,重复单位长度约成,重复单位长度约300 bp,多数散在于基因组中,总,多数散在于基因组中,总长度约占人基因组的长度约占人基因组的5 。
分类:分类:目录目录(二)中度重复序列(二)中度重复序列重复数十至数千次重复数十至数千次,大多数与单拷贝基因间大多数与单拷贝基因间隔排列短分散重复片段短分散重复片段长分散重复片段长分散重复片段平均长度约平均长度约300 bp500 bp,与长度约为,与长度约为1000 bp的单的单拷贝序列间隔排列拷贝数可达数十万如拷贝序列间隔排列拷贝数可达数十万如Alu家族、家族、KpnI家族、家族、Hinf家族平均长度为平均长度为3500 bp5000bpbp,与长度约为,与长度约为13000bp的单拷贝序列间隔排列的单拷贝序列间隔排列目录目录在单倍体基因组中只出现一次或数次,在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因大多数为蛋白质编码的基因三)单拷贝序列(低度重复序列)(三)单拷贝序列(低度重复序列)目录目录三、真核基因组中存在大量的多基因家三、真核基因组中存在大量的多基因家族与假基因族与假基因多多基基因因家家族族是是指指由由某某一一祖祖先先基基因因经经过过重重复复和和变变异异所所产产生生的的一一组组在在结结构构上上相相似似、功功能能相相关关的基因基基因因家家族族成成簇簇地地分分布布在在某某一一条条染染色色体体上上,同同时时发发挥挥作作用,合成某些蛋白质。
如组蛋白基因家族用,合成某些蛋白质如组蛋白基因家族基基因因家家族族的的不不同同成成员员成成簇簇地地分分布布于于不不同同染染色色体体上上,编编码一组功能上紧密相关的蛋白质如球蛋白基因家族码一组功能上紧密相关的蛋白质如球蛋白基因家族 目录目录DNA序列相似,但功能不一定相关的若序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称干个单拷贝基因或若干组基因家族总称超家族基因超家族基因 (superfamily gene)基因组中存在的一段与正常基因非常相似基因组中存在的一段与正常基因非常相似但不能表达的但不能表达的DNA序列以 来表示假基因(假基因(psuedogene)目录目录四、线粒体四、线粒体DNA结构有别于染色体结构有别于染色体DNA线线粒粒体体DNA(mitochondrial DNA,mtDNA)是是核核外外遗遗传传物物质质,能能独独立立编编码码线线粒粒体体中中的的一一些些蛋白质mtDNA的的结结构构为为环环状状分分子子,与与原原核核生生物物的的DNA类似,结构特点也与原核生物相似类似,结构特点也与原核生物相似目录目录人的线粒体基因组人的线粒体基因组线粒体基因组编码线粒体基因组编码3737个基因,包括个基因,包括1313个编个编码呼吸链多酶体系的一码呼吸链多酶体系的一些多肽的基因、些多肽的基因、2222个编个编码码mt-tRNAmt-tRNA的基因、的基因、2 2个个编码编码mt-rRNAmt-rRNA(16S16S和和12S12S)的基因。
的基因目录目录物种物种基因基因组组大小大小( (Mb) )基因数基因数染色体数染色体数* *支原体支原体 M. genitalium0.58470无无流感嗜血杆菌流感嗜血杆菌 H. influrnzae1.831743无无枯草芽枯草芽孢孢桿菌桿菌 B. subtilis4.204100无无大大肠肠杆菌杆菌 E. coli 4.604288无无酿酿酒酵母酒酵母 S. cerevisiae 13.50603416裂殖酵母裂殖酵母 S. pombe12.50492916燕麦燕麦 O. sativa4663000021果果蝇蝇 D. melanogaster165136014秀秀丽隐丽隐杆杆线线虫虫 C. elegans97184246小鼠小鼠 mouse27003000020人人 H. sapiens30。
