
人类基因组中的假基因.ppt
34页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第八章,人类基因组中的假基因,第一节,核基因组中的假基因,1977年,,Jacq等人在研究5S rRNA基因时发现了第一个假基因(pseudogene,G)他们在非洲爪蟾DNA中克隆了一个5S rRNA基因相似序列,与功能基因相比,这段序列的5端有16bp的缺失和另外14bp的错配,将这段5 S rRNA基因相似序列称为假基因一、假基因(,pseudogene),的发现,人的,5S,rRNA,基因有,2000,个拷贝,并且在染色体上串连排列;,非洲爪蟾的,5S,rRNA,基因的一个重复单位含有一个,5S,rRNA,基因、一个不转录的假基因,(101bp,的,5S,rRNA,基因的片段,),每个重复单位间被不转录的间隔序列隔开,间隔序列的长度变化不定,最长达,400bp,GJacp,在对非洲爪赡,5SrRNA,基因簇的研究后发现,G,核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因,生物演化上的痕迹,二、假基因类似人的痕迹器官,现已在大多数真核生物中发现了假基因,如,Hb,的假基因、干扰素、组蛋白、,球蛋白和,球蛋白、肌动蛋白及人的,rRNA,和,tRNA,基因均含有假基因。
由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官,或作为后补基因脊椎动物中的,珠蛋白基因族和假基因,假基因(pseudogene)定义,:基因组内,结构上与编码某一蛋白质的结构基因相似,在进化过程中获得突变而丧失了产生蛋白产物能力的序列片段,这类基因称为假基因为了表示假基因与结构基因的对应关系,假基因的命名是在结构基因后加一个P表示:,如:actin beta pseudogene,ACTB-P,或者:,ACTB,假基因的表示方法,三、假基因的分类与特点,根据形成机制分为两种类型,(1)非加工假基因(non-processed pseudogene)也叫复制型假基因(duplicated pseudogene),(2)加工假基因(processed pseudogene)或返座假基因(retropseudogene),复制型假基因,:,往往保留了功能基因的外显子内含子结构,有时这种结构是不完整的加工假基因的结构特点,:,(1)不同部位有不同程度的缺失或插入突变,常常形成移码及终止密码子;,(2)缺少正常基因的内含子和启动子;,(3)3端都有真核生物mRNA分子特有的AATAAA信号,造成转录启动区的缺陷;,(4)两侧有正向重复序列。
四、假基因的数量,五、人类基因组中假基因的分布,(2004年),六、小鼠基因组中假基因的分布,第二节,线粒体假基因,哺乳动物线粒体基因组(mtDNA)由,37个基因,和一段长度可变的,非编码序列,(又称控制区或D-loop)组成37个基因中,包括13个蛋白质基因,2个rRNA基因和22个tRNA基因,其中,13个蛋白质基因分别是,细胞素C氧化酶三个亚基、(CO、CO和CO),细胞色素b基因(Cytb)、ATP合成酶亚基ATPase6和ATPase8 和NADH脱氢酶七个亚基的基因NDl,ND2,ND3,ND4,ND4L,ND5,ND6一、线粒体基因组简介,动物mtDNA 基因组全序列结构示意图,哺乳动物,mtDNA,的,37,个基因都以相同的相对位置排列,(,仅 在有袋类和鸟类中有微小变化,),;,基因排列得十分紧凑,无重复、无内含子和转座因子,也没有基因间隔区,(,即使有也很短,仅,1,至数个核苷酸,),,有些基因部分序列重叠;,动物,mtDNA,中长度可变的非编码区是,mtDNA,复制及转录的起点及控制区;,尽管不同家畜的,mtDNA,大小稍有差异,但基因的数量和功能却相似;,家畜,mtDNA,的基因排列相当经济,两个,rRNA,基因相邻,基因中没有内含子,,22,个,tRNA,的基因位于,rRNA,和,13,个蛋白质基因之间。
1967年由DuBuy和Riley两位学者发现用提纯的,小鼠mtDNA和核DNA进行杂交,,发现两者的结合能力很强,,推断核基因组中存在mtDNA的同源序列直到1994年,,Lopez,等用southem杂交的方法在家猫核,基因组中发现了长为7.946kb的线粒体基因组同源序列,发现,这种序列是不能表达的假基因,,并以,nuclear mitochondrial DNA Segments(,Numts,),指代这种核基因组中存在的线粒体假基因二、线粒体假基因,三、线粒体假基因的特点,(1)核基因组中的Numts 片段已经涵盖了线粒体基因组的全部基因其中细胞色素b(Cytb)、调控区(D-loop)、细胞色素氧化酶C亚基1(CO)的插入频率较高2)Numts序列长短不一,短的有39bp,长的则几乎相当于整个线粒体基因组,并且Numts在核基因组中的拷贝数也可能很高3)核基因组中的Numts序列与其同源序列相比,进化模式完全不同对于原编码蛋白的假基因序列,经常出现终止密码子,碱基替换没有密码子位点倾向性,几乎平均分布4)Numts序列在核基因组中进化速率很低,所以常被认为是mtDNA序列的“分子化石”。
arctander等对于八种窜鸟Cyt b基因的真假序列进行研究发现,,mtDNA 的进化速率是Numts序列的13.6倍,5)有些Numts序列还可以作为独立的元件在核基因组中复制、移动Hazkani等研究发现在人类核基因组的Numts序列中只有,30%是线粒体基因片段转移到核中形成的,其余70%都是转移以后在核基因组中不断复制、转座而成植物,哺乳动物,昆虫,鸟类,四、线粒体假基因的研究范围,五、假基因存在的意义,1 Numts序列为物种系统发育学研究提拱新的方法,比较mtDNA与Numts两种序列进行系统发育研究的结果,更能客观地反映物种的进化关系,也是对传统mtDNA方法的校验Sato等在达尔文雀的研究中,应用了两段numt序列和两段mtDNA序列分别作分子标记,结果显示,两种序列建立的系统发育树结果基本相同这说明numt序列在系统发育研究中有很好的应用价值2 Numt序列是细胞核内外两套遗传物质研究的桥梁3 假基因进化速率很低,保留了远古基因的信息,因此,成为研究生物进化和动态基因组的重要线索4 Numts序列进化速率低,常被认为是mtDNA的“分子化石”,因此,可以作为某些系统发育研究的外群。
在人类起源问题的研究中,Zischler等用mtDNA的D-loop区作为分子标记,由于没有合适的mtDNA外群,Zischler等应用了在人类核基因组中的一段D-loop区假基因作为外群证实了现代人类起源于非洲的假说5 假基因如同基因备份序列存在于基因组中,通过对非加工假基因的分析,发现它们大多与环境互作的蛋白质相关,并且总是存在其同源基因的附近因此,有人推测,生物能将重要的基因复制起来作为备份以抵抗不利的环境影响在鸡基因组,发现与免疫球蛋白有关的功能基因由假基因形成6,新基因的形成,1 国外,:,人类,酵母,果蝇,小鼠,线虫,斑马鱼等的数据及研究成果2 国内,:,鸟类线粒体假基因遗传特征及其进化研究,(辽宁师范大学),;,水稻假基因数据库的构建及其基因的分子进化研究(,浙江大学),;,假基因8(NANOGP8)在肿瘤发生中的作用研究,(中科院遗传与发育生物研究所),六、国内外研究情况,发现了,5,条,cytb,假基因;,Numts,序列在核基因组中进化速率比,mtDNA,低,但是,Numts,与,mtDNA,进化速率的比值对于不同物种来说都是变化的;,Numts,转移到核基因组之后作为非编码区其进化模式与线粒体的功能基因不同,其碱基替换没有密码子倾向性,在各个位点几乎是平均分布的,同时转换颠换的比值降低,没有明显的转换倾向性。
1)禽类Numts的研究,在籼稻,9311,基因组内发现了,4607,个加工假基因、,2153,个复制假基因和,6720,个假基因片段初步分析发现,水稻中的假基因在着丝粒区域分布较为密集,加工假基因尤其明显水稻中,GC,含量和基因密度成线性关系,而假基因和,GC,含量则没有这种关系2)水稻假基因研究,研究癌组织、癌细胞系、畸胎瘤细胞系和正常组织中,OCT4,假基因的转录通过生物信息学的方法发现了,OCT4,基因的,6,个假基因其中,OCT4-p5,和,OCT4-p1,在肿瘤中转录而不在畸胎瘤细胞系、正常组织和成纤维细胞中转录提示,,OCT4-p5,和,OCT4-p1,可能调控,OCT4,基因的活性进而与肿瘤发生有关3)肿瘤发生中OCT4假基因,技术路线,Thank you!,。
