好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

3基因和基因组1.ppt

103页
  • 卖家[上传人]:博****1
  • 文档编号:579638045
  • 上传时间:2024-08-27
  • 文档格式:PPT
  • 文档大小:1.15MB
  • / 103 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第3章 基因和基因组揣吻桐颐向瘴谰子球平磺砖盟限谊笑湖慑熔乒莽班央舷超呸孟咒赤约坏宁3基因和基因组13基因和基因组1 生物体内的一切生命活动都直接或间接地在基因的控制之下,人们会越来越多地在深入研究基因结构和功能的基础上,改良物种,控制疾病,提高人类的生活水平和生活质量因此,基因及其功能的研究,一直是分子生物学的核心内容 1990年代以来,随着DNA序列测定技术的发展和进步,结构基因组学的发展十分迅速,十多种重要模式生物的基因组全序列测定已经完成人类基因组的全序列测定已于2003年宣告完成,不同人群DNA序列的多态性研究,个人基因组全序列的测定正在积极推进结构基因组学和比较基因组学的研究成果,已经和正在推进着生命科学基础研究和应用研究的迅速发展 同时,功能基因组学的研究也在快速发展,基因及其表达产物的功能研究,正在为疾病控制和新药开发提供越来越多的思路同时,也为作物和畜禽品种的改良提供新思路,为人类解决健康问题、食物问题、能源问题和环境问题提供新方法搀骨斯整冀写烤衡思棋汞氰摈戍毯止脾鳃泼蓄分奖舒奸蓝叁砷亡惶捐叁氦3基因和基因组13基因和基因组1 3.1 基因的概念基因的概念 Mendel提出的遗传因子是决定某个遗传性状的抽象符号,1909年丹麦生物学家Johannsen根据希腊文“给予生命”之义,用基因基因(gene)一词代替了Mendel的遗传因子。

      然而,这里的基因依然是一种与细胞的可见形态结构毫无关系的抽象概念 Morgan及其助手通过对果蝇的研究发现,一些性状的遗传行为之所以不符合Mendel的独立分配定律,是因为代表这些性状的基因位于同一条染色体上彼此连锁Morgan将代表某一特定性状的基因,同某一特定的染色体联系起来基因不再是抽象的符号,而是在染色体上占有一定空间的实体 但是早期研究曾认为遗传物质是蛋白质,1941年Beadlr和Tatum 研究红色面包霉的营养缺陷突变体,发现每一种突变都同一种酶有关,因而提出一个基因一个酶的学说Beadlr和Tatum因此而荣获了1958年的诺贝尔生理学或医学奖,但这一学说并未解决基因的化学本质问题直到1944年,Avery等人通过肺炎链球菌转化实验证明,基因的化学本质是DNA 秸赡司稻面裴衅辰囚盼庶入恒湿抓赋冀勋躇畅辰孽恭初喀朵玛棵振待胜忌3基因和基因组13基因和基因组1 在遗传学的早期阶段,基因被看作是在功能、突变和交换方面都不可再分割的遗传单位1957年Benzer研究发现T4噬菌体感染大肠杆菌后,控制寄主细胞致死效应(快速溶菌)的功能,是由该噬菌体的rII区编码的。

      深入研究发现rII分为rIIA和rIIB亚区,用rIIA或rIIB的突变型分别单独感染E. coli K菌株,很少发生溶菌裂解而用两种突变型混合感染时,则发生大量宿主菌的溶菌裂解即一个突变点在rIIA,另一个突变点在rIIB时,两个噬菌体颗粒才能彼此互补,出现野生型的表型说明rIIA和rIIB是两个不同的功能单位,Benzer用顺反子顺反子(cistron)一词,将其分别称为rIIA顺反子和rIIB顺反子,认为顺反子就是一段能编码一条完整多肽链的核苷酸序列 随后分析了几千种rII 的突变,其中有几百个不同的线性排列的突变位点根据Benzer的计算,在功能DNA中,最小交换单位为1~3个核苷酸后来的研究发现,顺反子中的最小交换单位(交换子)和最小突变单位(突变子),均为 DNA分子中的一个核苷酸对作为功能单位的顺反子,包含多个突变位点和交换位点穆啃泣皋惺柯落瞥如贴有鸵胀贩雪力专框素狡已寓竣缘祸况寄泞锐迁宵袖3基因和基因组13基因和基因组1 顺反子通过顺反试验确定,如两个位点可以互补,则不属于一个顺反子;如两个位点不可以互补,则属于同一个顺反子 上图为突变发生在相同基因无互补,下图为突变发生在不同基因,图中蓝条表示基因,红点表示突变位点。

      翱久解蘑谰趁蠕钓汽主萄挖琶癸肮若瞬哀稍迂柯摸槐丽踢酿蚌跋氰悬箩庄3基因和基因组13基因和基因组1 1958年Crick提出中心法则中心法则,认为DNA通过转录和翻译控制蛋白质的合成1961年Jacob和Monod提出操纵子学说操纵子学说,和结构基因、调节基因、操纵基因等概念结构基因结构基因(Structure gene)是指为蛋白质或RNA编码的基因,结构基因的突变可导致蛋白质或RNA一级结构的改变结构基因的5'-端非编码区(5'-untranslated region, 5'-UTR)包括RNA聚合酶的识别和结合位点,被称作启动子(Promoter),以及原核生物mRNA起始密码子上游的核糖体结合位点(ribosome-binding site, RBS),或SD序列(以发现者的名字命名)真核生物的mRNA不含SD序列,其5'-端的帽子结构可以同核糖体相互识别结构基因的3'-非编码区(3'-UTR)包括促使转录终止的终止子(terminator)序列,和真核生物的加尾信号等调节基因调节基因(regulator gene)的功能是产生调控蛋白质,调控结构基因的表达。

      操纵基因操纵基因(operator gene)的功能是与调控蛋白质结合,控制结构基因的表达调节基因和操纵基因的突变会影响一个或多个基因的表达活性坛是抬孩趁穆辩济绽绰丸译费敏条典纠哗摹份肯屋枯嘛撂鲍戚历襟钩悄徊3基因和基因组13基因和基因组1 1977年Sanger测定了ΦX174的DNA序列,发现了重叠基因同年,Jacp发现了与基因序列相似,但不能产生表达产物的假基因Sharp和Robert发现了真核生物的多数基因的编码区被一些被称作内含子的非编码区分割成了若干个称作外显子的小片段,提出断裂基因的概念所以,将基因定义为编码序列及其调控区是不全面的 广义来讲,应当将基因基因定义为,DNA或RNA分子中有特定遗传功能的一段序列基因主要位于染色体上,此外,细菌的质粒、真核生物的叶绿体、线粒体等细胞器都含有一定的DNA序列,其中大部分是具有遗传功能的基因,这些染色体外的DNA称为染色体外遗传物质 轨邹路寅低指椎烙草潞遥朵钥诬巍并缸雷书境权蜘税知免爹裕即驶檄枚翻3基因和基因组13基因和基因组1 3.2 基因的类型基因的类型3. 2.1 基因家族和基因簇基因家族和基因簇 基因家族基因家族(gene family)是真核生物基因组中来源相同、结构相似、功能相关的一组基因。

      基因家族各成员序列上具有相关性,但相似的程度以及组织方式不同基因家族可能由某一共同祖先基因(ancestral gene)经重复(duplication)和突变产生 按照基因家族的成员在染色体上的分布,可以将基因家族分成两类一类是串联重复基因串联重复基因(tandemly repeated genes),成簇的基因家族(clustered gene family),或基因簇基因簇(gene cluster),是基因家族的各成员紧密成簇排列而成的串联重复单位,定位于染色体的特殊区域从分子进化的角度看,它们可能是同一个祖先基因扩增的产物在基因簇中,也有一些基因家族的成员中间包含一些间隔序列,但大多数分布在染色体上相对集中的区域另一类称作分散的基因家族分散的基因家族(interspersed gene family),其家族成员在DNA上无明显的物理联系,甚至分散在多条染色体上,各成员在序列上有明显的差别砾比蓄踊汗孰拨辩巨定耀潮撼阅锥棠燥绥从惠旭兽狙顿海晤勃杭洋帝孕护3基因和基因组13基因和基因组1 3.2.1.1 简单的多基因家族简单的多基因家族 家族中各基因的全序列或至少编码序列具有高度的同源性,如rRNA基因家族。

      真核生物的rRNA基因串联重复排列在一段很长的DNA区域内重复单位内rRNA基因转录区的序列几近相同,而非转录的间隔序列则有所不同在低等真核生物如酵母的rRNA基因家族中,28S, 18S, 5.8S和5S rRNA基因构成一个转录单元,而高等真核生物的5S rRNA基因则单独作为一个基因家族排列在其它部位每个转录单元重复排列成基因簇,基因之间由可转录的间隔区(TS)分开,各转录单元之间由不可转录的间隔区(NTS)分开(图3-1) 苹拥竞蕊拘孩潦需笨贷卖检婆愿窟徒戚川萨裹励轮压移才曝靠七专数灸零3基因和基因组13基因和基因组1 3.2.1.2 复杂的多基因家族复杂的多基因家族 复杂的多基因家族由几个相关基因构成独立的转录单元,家族间由间隔序列分开例如,组蛋白基因的5个成员(H1, H2A, H2B, H3, H4)就属于这一类型人类组蛋白基因分布在第7号染色体,拷贝数为30~40个 嘻领藉但钞朴伶准判贰朝苑呈从桓龋面向啸擦禾酶危苟绰硫肥融泊挑荣扬3基因和基因组13基因和基因组1 3.2.1.3 受发育调控的复杂多基因家族受发育调控的复杂多基因家族 人类珠蛋白基因家族是典型的受发育调控的复杂多基因家族,α-珠蛋白基因簇位于16号染色体上,包括1个活化的基因ξ,1个假基因ψξ,2个α基因,2个假基因ψα和1个未知功能的θ基因。

      β-珠蛋白基因簇位于第11号染色体上,包括ε,2γ,δ,β 5个有功能的基因和一个假基因ψβ(图3-3)两个γ基因编码的蛋白质只有一个氨基酸的差别,即G蛋白质的13位是Gly,而A蛋白质在这个位置上是Ala在不同的发育阶段,由α基因家族和β基因家族中的不同基因产物(即亚基)各两个,组成血红蛋白的四聚体 乓贬斋孟溜哇蔬忙阁流戌薛床汹奖娃蛇潭籽箕淫缆塔峙踢随饿瓣她畦俭豆3基因和基因组13基因和基因组1 在人类珠蛋白基因家族中,基因排列的次序与它们在个体发育阶段基因表达的先后次序一致在α家族中,ξ基因在胚胎早期(前8周)表达,胎儿期(8周后)关闭,α2和α1在胎儿(8周后)和成人期都表达在β家族中,ε基因排在最前面,在胚胎早期(8周内)表达,之后关闭Gγ和Aγ基因在胎儿期表达,出生前表达量逐渐衰减,而出生后并不完全关闭,仍然少量表达δ基因在胚胎期和成年期都有少量表达β基因在胚胎期开始表达,表达量逐渐增加,是成人阶段表达的主要基因(表3-1)胚胎期和胎儿期的血红蛋白对氧的亲和力较高,因此,可以从母体血液中获取氧 穿座指侧巧豺嘉粳溉愚谬勉慎拧盅她习官作镣恰垫爷鲁仁朋孜维然兢抬台3基因和基因组13基因和基因组1 16号染色体11号染色体通嘲归蹈着蚕焰彝铝恳猪赘楷奏绕我姬伴步逐技幼梁或馏泼吮带稠维先少3基因和基因组13基因和基因组1 3.2.1.4 超基因家族超基因家族 超家族基因超家族基因(gene superfamily)是指一组由多个基因家族组成的更大的基因家族。

      在高等真核细胞内,有些基因簇内含有数百个功能相关的基因,它们是由基因扩增后结构上的轻微变化而形成的,在结构上有着不同程序的同源性这些基因或保持了原始基因的基本功能,或进化产生了某些新功能目前已发现了很多的超基因家族,典型的例子有免疫球蛋白超基因家族、核受体超基因家族、细胞因子超基因家族等 免疫球蛋白(immunoglobin, Ig)超基因家族包括β2微球蛋白、MHC I类α链、II类α和β链、T细胞受体(TCR)的 α链和β链、CD4和CD8等与免疫有关的大分子还有许多与免疫反应无关的蛋白质分子,如IgE受体α亚基,神经黏附分子L-1,白细胞介素IL-1和IL-6的受体等视烽桐腊坑羔涨协熏诲哑循吱烁蓬蝉苫征残盗缕篆秩搬踪晦钓瞎帅羞蜡烧3基因和基因组13基因和基因组1 Superfamily is a set of genes all related by presumed descent from a common ancestor, but now showing considerable variation. Immunoglobulin type and function is determined by the heavy chain. J is a joining protein in IgM and IgA; all other Ig types exist as tetramers.戮鞭闽擦佐喝楞对猖乎徘捂泥埂送站稳瘦苛俯蛆食陕妖雍侨枣唉萍淀衰裳3基因和基因组13基因和基因组1 FamilyV GenesC GenesManMouseManMouseLambda<3002>64Kappa<300~100011Heavy~300>100098Each immunoglobulin family consists of a cluster of V(variable) genes linked to its C(constant) gene(s).苞漱币跺习假椭钞逊慈友坤磊唱钙烙划封甜置打涉狼箭贰浊斩晌袍侨力呐3基因和基因组13基因和基因组1 The lambda family consists of V gene segments linked to a small number of J(joinng)-C gene segments.完假酒笼荤饥余叁华猿例颧你定河驭礁宗充入掐挡咱闰柏戳犊骤斗尺孤嚏3基因和基因组13基因和基因组1 The human and mouse kappa families consist of V gene segments linked to 5 J segments connected to a single C gene segment.迅塑他幼毛扇讶遏臣侧雷寓欢埋腮懦号具拯筏擞谣嗽早炒弃互礁竭绞盲钟3基因和基因组13基因和基因组1 A single gene cluster in man contains all the information for heavy-chain gene assembly.粕邓蚕宅矗最恬兼间吻举缘鲍己涉呸瓶霉劳素核压蔡畔沮店赫耳镊利粪媚3基因和基因组13基因和基因组1 Heavy genes are assembled by sequential joining reactions. First a D(diversity,多样性) segment is joined to a J segment; then a V gene segment is joined to the D segment.美计睛斤安跌无蹲祈寓辱竣兑屯插镭痔捂懂醇唤惟婪夫晤棵瓮五旨桂捡渭3基因和基因组13基因和基因组1 The TCR locus contains a small number of functional V gene segments (and also some pseudogenes; not shown), lying upstream of the J-C loci.险志尤郎疼徒谆趋襟谈饯淹摔向院灼磐拣后桌历虱吞娃司纳缎真拖瑞稍派3基因和基因组13基因和基因组1 The two chains of the T-cell receptor associate with the polypeptides of the CD3 complex. The variable regions of the TCR are exposed on the cell surface. The cytoplasmic domains of the ξ chains of CD3 provide the effector function.删我足侍粤遗锯投辑敦卧海闹撮涵婉练蒙顺竖圣澎试兢纹判岿施辨叭审歌3基因和基因组13基因和基因组1 The B cell antigen receptor consists of an immunoglobulin tetramer (H2L2) linked to two copies of the signal-transducing heterodimer (Iga-lgb).取汁附奴露凿疤军俯膀榷挛破窥犯茧谚忿嵌兴胰悲苞沧兢冈依镀盼祈宰源3基因和基因组13基因和基因组1 The histocompatibility locus of the mouse contains several loci that were originally defined genetically. Each locus contains many genes. Spaces between clusters that have not been connected are indicated by queries.袁夜讳奎赫安房论届钳遍招入氮省呕娘辊稠嫁史唤近复冰毛卒董仿氏腔脊3基因和基因组13基因和基因组1 The human major histocompatibility locus codes for similar functions to the murine locus, although its detailed organization is different. Genes concerned with nonimmune functions also have been located in this region.颁寺痴叛螟撵蜜盾趋蹭湃荤诗虽俄裁寓悔捡堤利颧好勺罚脏纲拓柳他翌踞3基因和基因组13基因和基因组1 Class I and class II histocompatibility antigens have a related structure. Class I antigens consist of a single α polypeptide, with three external domains (α1, α2, α3), that interacts with β2 microglobulin. Class II antigens consist of two (α and β) polypeptides, each with two domains (α 1 & α2, β1 & β2) with a similar overall structure.耶油秸藉馅颊械眉卢怒优犊烩纺栋茸萨帆冒管瞬淤话系疗面坏衔子份菌欺3基因和基因组13基因和基因组1 Each class of MHC genes has a characteristic organization, in which exons represent individual protein domains版煮芭芯遇零迷爆喳砧蜀荒点傣仲烘裙怯个筏遣遗熄兹脓颓办织伦途忽交3基因和基因组13基因和基因组1 3.2.2 假基因假基因 多基因家族中的有些成员DNA序列与有功能的基因相似,但不能表达产生有功能的基因产物,称假基因假基因(pseudogene),常用符号ψ表示,如ψa1表示与a1相似的假基因。

      许多假基因都与亲本基因(parental gene)连锁,且编码区及侧翼序列都具有高度同源性通过序列比对发现,这类假基因最初是有功能的,由于发生了缺失(deletion)、倒位(inversion)、点突变(point mutation)等,使该基因失去了活性,成为了无功能的假基因 此外,在真核生物的染色体基因组中还存在着一类加工的假基因(processed pseudogene)这类假基因不与亲本基因连锁,结构与转录物相似,如没有启动子和内含子,但在基因的3'-端有一段连续的腺嘌呤短序列,类似mRNA 3'-端的polyA尾巴这些特征表明,这类假基因很可能是来自加工后的RNA,称作加工的假基因 抒撤障轧霄肺尊圈锑旷茵晚妓耻夫梧易艇足盲舵瑟晌嫡总蓉纳漓赘障阑絮3基因和基因组13基因和基因组1 Processed pseudogene is an inactive gene copy that lacks introns, contrasted with the interrupted structure of the active gene. Such genes presumably originate by reverse transcription of mRNA and insertion of a duplex copy into the genome.Pseudogenes could arise by reverse transcription of RNA to give duplex DNAs that become integrated into the genome.敌扇兑阐妨同港奉灰市罕度而冲玄审斟脂义浪溶辣私橇搏肤山甥酱憾晾侗3基因和基因组13基因和基因组1 假基因由于存在以下几个原因中的一个或几个,因而没有表达活性:① 缺乏有功能的调控区,使其不能进行正常的转录。

      ② 虽然能转录,但由于突变或缺失等,引起mRNA加工缺陷而不能翻译③ mRNA的翻译被提前终止④ 虽然能翻译,但生成的是无功能的肽链在真核生物基因组中,假基因的存在比较普遍,如α珠蛋白质和β珠蛋白质基因簇中都存在1~2个能与真核基因序列进行分子杂交,但又没有正常功能的DNA区域 舔废失种闯攒吸婉界抒墟管场屋卤肮梅骂椽恕弟紊傀该闷俞怂魁仍窟焕殆3基因和基因组13基因和基因组1 传统的基因概念把基因看作彼此独立的、非重叠的实体但是,随着DNA测序技术的发展,在一些噬菌体和动物病毒中发现,不同基因的核苷酸序列有时是可以共用的也就是说,它们的核苷酸序列是彼此重叠的这种具有独立性但部分序列彼此重叠的基因称重叠基因重叠基因(overlapping genes)或嵌套基嵌套基因因(nested genes) 近年来的研究发现,重叠基因在真核生物中是广泛存在的值得注意的是,高等真核生物中既存在大量的非编码序列,又普遍存在重叠基因,其生物学意义目前所知甚少,有待于进一步深入研究 3.2.3 重叠基因重叠基因份堆孽透草票猪躬掀鼎祭扦彝刚蹋天念圭厌沿售趣哟办冀阴筏神铂圣瞬扭3基因和基因组13基因和基因组1 3.2.4 移动基因移动基因 移动基因移动基因(movable genes)又称转座因子转座因子(transposable elements)。

      由于它可以从染色体的一个位置转移到另一个位置,甚至在不同染色体之间转移,因此也称跳跃基因跳跃基因(jumping genes) 转座(transposition)和易位(translocation)是两个不同的概念易位是指染色体发生断裂后,通过连接而转移到另一条染色体上转座则是在转座酶的作用下,转座因子或是直接从原来位置上切离下来,然后插入新的位置,或是染色体上的DNA序列转录成RNA,随后反转录为cDNA,再插入染色体上新的位置转座因子本身既包含了基因,如编码转座酶的基因,同时又包含了非编码的DNA序列关于移动基因的详细介绍见第6章 砧僧窍韩浦类淘掇虑蛊俄任放虽半犹匙超乞割辫节生笛帧腔债蝇蛋詹杏宠3基因和基因组13基因和基因组1 3.2.5 断裂基因断裂基因3.2.5.1 断裂基因的概念断裂基因的概念 过去人们一直认为,基因是连续不断地排列在一起一段DNA序列但是对真核生物编码基因的研究发现,在编码序列中间插有非编码的DNA间隔区,这些间隔区称为内含子内含子(intron);而编码区则称为外外显子显子(exon)含有内含子的基因称为不连续基因或断断裂基因裂基因(split genes)。

      一个基因的两端起始和结束于外显子,对应于其转录产物RNA的5'-端和3'-端如果一个基因具有n个内含子,则相应地具有n+1个外显子 戍拳粒池飞酒谩逊拱廷港镍它酌预靶首蔗劲铲轧逞舷森笺哲惜匹类镣层石3基因和基因组13基因和基因组1 断裂基因是Roberts和Sharp于1997年在研究腺病毒六邻体外壳蛋白质的mRNA时首先发现的,病毒DNA与它的mRNA进行分子杂交时,在电镜下观察到未与mRNA配对的DNA形成多个突环,称R环R环的形成说明腺病毒外壳蛋白质的基因具有mRNA中不存在的序列,这些序列就是内含子 图3-5中的(a)为电子显微镜照片,(b)为对电子显微镜照片进行解释的示意图,(c)为腺病毒六邻体外壳蛋白质基因结构的示意图后来发现,鸡卵清蛋白质的基因与其mRNA杂交也会出现与其内含子数对应的7个R环 鲤王帛佣稠创拧党金泊衬藤磅亨瀑映践殆捂嘲袖劈至那欧档商菠惮影哟市3基因和基因组13基因和基因组1 研究断裂基因的另一个方法是比较基因组DNA和cDNA的限制性核酸内切酶图谱cDNA是由成熟的mRNA通过逆转录生成的,因而不含内含子若用相同的限制性核酸内切酶水解基因组DNA和cDNA,在同样的条件下进行凝胶电泳,如果内含子中有限制性核酸内切酶的水解位点,基因组DNA的电泳图谱中就会有相应的条带,而cDNA电泳图谱中的相应条带则会缺失。

      研究发现,断裂基因在表达时首先转录成初级转录产物,即前体mRNA,然后经过后加工,除去内含子序列的转录物,成为成熟的mRNA分子这种删除内含子、连接外显子的过程,称为RNA拼接或剪接 增迂猿霖熙磕宴舌狂道锣篷缨休姻悔菠播馒睦姓羚册纺贸希部备兢甜侩恬3基因和基因组13基因和基因组1 Comparison of the restriction maps of cDNA and genomic DNA for mouse β-globin shows that the gene has two introns that are not present in the cDNA. The exons can be aligned exactly between cDNA and gene. 通过比较cDNA与基因组DNA的限制性核酸内切酶图谱,也可以分析内含子的数量汝柬速甘眷捧鸽铣由哆锤沛阻巳罐铡沿导灸梭桌使席敝剐助丧湍棺氧造糕3基因和基因组13基因和基因组1 The ovalbumin gene, shown here, has introns A to G and exons 1 to 7 and L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol II extends the primary transcript well beyond the cleavage and polyadenylation site (“extra RNA”) before terminating transcription. Termination signals for Pol II have not yet been defined.Overview of the processing of a eukaryotic mRNA已曹氏严突碎苹诊为朵塔筷诣搽齐直迭阑称澡颂噶菌喧绳搭晌膀岛析沥怔3基因和基因组13基因和基因组1 An intron is a sequence present in the gene but absent from the mRNA (here shown in terms of the cDNA sequence). The reading frame is indicated by the alternating open and shaded blocks; note that all three possible reading frames are blocked by termination codons in the intron.窖少愚兔啡倍希瘤肢嫡虱呸钟淀伞嫁墓帮即昌圭鹊玛倡疡挚幽怀坐壤镍统3基因和基因组13基因和基因组1 3.2.5.2 断裂基因的分子进化断裂基因的分子进化 在真核生物的进化过程中,断裂基因的比例在逐渐增加。

      低等真核生物酿酒酵母中的大多数基因是连续的,少数基因含有较短的外显子,其数量不超过4个真菌基因的外显子少于6个,基因长度不超过5kb在高等真核生物中,开始出现长基因,蝇类和哺乳动物基因很少小于2kb,大多数长度在5~100kb,含有几个到几十个内含子但当基因的长度大到一定程度后,DNA的复杂性与生物的复杂性之间开始失去对应关系例如,虽然属于同一个门,家蝇细胞的DNA总量却是果蝇的6倍在较高等的真核生物中,基因大小主要取决于内含子的长度,与外显子的大小和数目关系不大动物细胞的内含子一般为80~100kb,平均1127bp,有保守的分支点序列及多聚嘧啶区段植物细胞的内含子较短,一般为80~2000bp,平均183bp 撑桃柏晴悲荐目赋拢株病萎诸依清驴吧揣苍垂捍哄裁宿仙椅助旦烧撇凸犊3基因和基因组13基因和基因组1 DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外显子组成,相对应mRNA长度为2000bp,但是它的DNA序列却十分长,这是由于它的内含子非常长的缘故,在三种哺乳动物中,外显子基本保持一样,内含子的相对位置也不改变,但长度变化却非常大,这就导致了基因长度范围为25~31kp。

      Mammalian genes for DHFR have the same relative organization of rather short exons and very long introns, but vary extensively in the lengths of corresponding introns.塔莹腑戴浙酿停糙荡漂隐晶唬裂昨拧柄报沦凛贱聘两矩铭毖挞骡深媳速寓3基因和基因组13基因和基因组1 研究发现,基因与其表达产物蛋白质都是由一些结构元件,即模块装配而成的大约有半数基因的外显子与蛋白质结构域、亚结构域或结构基序有很好的对应关系例如,磷酸丙糖异构酶基因有9个外显子,其编码的蛋白质有9个与之对应的结构域(图3-6) 费虚座涤析氧莲升署饱尧迹寐螺泻浙痹谗秘任醒戊吨盒讽鸟求弹戈卉盼拖3基因和基因组13基因和基因组1 Immunoglobulin light chains and heavy chains are coded by genes whose structures (in their expressed forms) correspond with the distinct domains in the protein. Each protein domain corresponds to an exon; introns are numbered 1-5.免疫球蛋白是两条轻链、两条重链组成的四聚体,每类基因都有一系列外显子相应于蛋白不同的结构域。

      汁阴变猫褂孤盒姻躇漫惟弹丽蹄稽湛细绚搪峦既趣申鱼漳刨卞万般铆半瞎3基因和基因组13基因和基因组1 外显子和蛋白结构域之间并非总是简单的对应关系,有迹象表明,在演化中,外显子的复制和合并也起了相当重要的作用有一些学者认为最初的蛋白质是相当小的,通过不断的复制、变化、重组而产生了现在各种蛋白质泅洽薯锋谬肆漏内剥削晾互狞薄依乱擅伶阁铂缝单迸丽敷矗榜泄纫冕喜耶3基因和基因组13基因和基因组1 另有约半数的基因则找不出外显子与蛋白质结构域的对应关系这可以解释为,在漫长的进化历程中,由于变异而使这些模块(结构元件)的边界逐渐模糊以至消失了如乙醇脱氢酶基因有10个外显子,酶催化部位来自第1~4个和第10个外显子相应肽段构成的结构域第5~9个外显子编码的肽段位于催化部位的外围 可以认为,各种结构基因都是由不同来源的外显子作为模块构成的嵌合体原初的蛋白质分子或许由更小的模块(相当于二级结构或超二级结构)装配而成,这些模块不一定能有特殊的功能,但几个小模块组合起来就可形成某种有功能的大模块蛋白质分子通过不断增加相应的新模块而获得多种功能,而这些模块的来源则是新组合到结构基因内的外显子序列。

      新加入到蛋白质分子中的模块,在分子折叠过程中一般倾向于留在分子表面,对蛋白质分子内部原有的结构影响不大 陌酞书喇辙蛙父碍片旋干拈疟掂棵烬正捏私谷蔓陈床猜怕催倔冤束莆慑巫3基因和基因组13基因和基因组1 在基因的进化中,可能发生外显子的复制,结果在结构基因内出现了重复序列在鸡的胶原蛋白质基因中,一个54bp的外显子多次重复,某些外显子累积突变,失去编码功能,就可能转化为内含子 外显子作一种功能模块,可以组装到不同的基因内因此,在基因进化中,经常发生着外显子在不同基因之间的复制、迁移和吸纳例如,在多种脱氢酶的基因内,均有几乎相同的与辅酶结合或脱氢酶催化区域功能有关的外显子结构另一个典型的例子是人类低密度脂蛋白质(low density lipoprotein, LDL)受体与其他蛋白质之间的关系LDL受体基因由18个外显子构成,中间的几个外显子也出现在生长因子前体的基因内,其N端的几个外显子也为血蛋白质互补因子C9编码 艰潭同潞移墓警事撮钉灌圈采规丸捂感绷妙汕羽宵具托撼掘其捷递都愉墨3基因和基因组13基因和基因组1 The LDL receptor gene consists of 18 exons, some of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the EGF gene.LDL(低密度脂蛋白)受体基因的中心部分的一系列外显子和EGF(表皮生长因子)前体基因同源,在其N端的外显子序列和血蛋白补充因子C9的基因同源,这说明LDL基因中一系列不同功能的组份组合而具备了新的功能,而这些组份也存在于别的蛋白中。

      砷别淳壹电灯虞似虽抡况断菲葛世谋洁阶若葵姬填趋涡珠潜果啼日输矗深3基因和基因组13基因和基因组1 产生新基因的另一种方式是某些内含子插入到外显子内,使外显子变得更小,或将内含子切除,使外显子变得更大例如,珠蛋白超家族包括血红蛋白(hematoglobin)、肌红蛋白(myoglobin)和豆血红蛋白(leghemoglobin),以及其它血红素结合蛋白血红蛋白分子是由2个α-珠蛋白和2个β-珠蛋白分子构成的四聚体肌红蛋白为单体,结构类似于珠蛋白豆血红蛋白类似于肌红蛋白,可能是珠蛋白相关基因的共同祖先肌红蛋白和珠蛋白基因内第2外显子负责与血红素结合,而豆血红蛋白不同于珠蛋白和肌红蛋白,它的基因有3个内含子,其中第2内含子把血红素结合域的外显子又分隔成2个外显子可能的进化途径是,豆血红蛋白丢失内含子,使珠蛋白或肌红蛋白的两个外显子融合成了一个 果泊极响佳箍妨怨摄郁屠彰舟爪贯鸭刘芹以凤诅益推殴势睬电初便横典擒3基因和基因组13基因和基因组1 Some interrupted genes possess only one or a few introns. The globin genes provide an extensively studied example. The two general types of globin gene, α andβ , share a common type of structure. The consistency of the organization of mammalian globin genes is evident from the structure of the "generic" globin gene summarized in figure. All functional globin genes have an interrupted structure with three exons. The lengths indicated in the figure apply to the mammalian β-globin genes. 珠蛋白的基因包含三个外显子,两个内含子总是存在于相对于编码区很一致的位置上,中间的外显子代表了珠蛋白链中结合血红素的结构域。

      活性蛋白是由2个α珠蛋白链和2个β珠蛋白链组成的四聚体戍蛹位廓磨御贸烧充李壬夺锈钱恍毯傅搽母拿作冤耶里测热肩岸铣忙斯小3基因和基因组13基因和基因组1 The exon structure of globin genes corresponds with protein function, but leghemoglobin has an extra intron in the central domain.桔凸答憋弗演脓堰昏藏约炙葛熬翁隋鄂投蜡潭疏腹漳虽卷削反偿屎不彦叉3基因和基因组13基因和基因组1 血红蛋白是动物体内结合氧的单聚体蛋白,豆血红蛋白是豆类植物中结合氧的蛋白,它们和别的血红素结合蛋白有着共同的祖先肌红蛋白,血红蛋白和豆血红蛋白共同组成了球蛋白超家族,它们的基因组成是一个基因家族,也是由共同祖先演化而来的 血红蛋白是由人类基因组中一个基因所编码的,它和肌红蛋白基因基本上一样,三个外显子结构说明由于基因的演化形成了血红蛋白和球蛋白功能的分离 豆血红蛋白的基因含有三个内含子,第1个和第3个的位置和球蛋白2个内含子所处位置是相同的这种惊人的相似说明很多血红素结合蛋白都是通过基因割裂而来的。

      在豆血红蛋白中,中心的内含子将相应的球白中心外显子序列分割成两部分,是肌红蛋白的中心外显子由古代的两个外显子合并而来,还是在单一的中心外显子中插入了一段内含子而形成了豆血红蛋白呢?这一问题还有待研究 京密稼含别窄斥蓬祷怔髓批锈骗瓷盔送燥驭胯妻恿蝴蛀投嫡犀操埔衍鲍摆3基因和基因组13基因和基因组1 The rat insulin gene with one intron evolved by losing an intron from an ancestor with two interruptions. 哺乳动物(除了啮齿类)和鸟类编码胰岛素的基因是由同一基因演化分离而来的鸡的胰岛素基因有2个内含子,大鼠的其中一个基因与之有相同的结构这个共同性说明胰岛素最初有2个内含子,而大鼠的另一个基因只含有1个内含子,说明它在演化过程中首先进行复制,然后从一个拷贝中精确地移去了一个内含子垄邻镶诈硬浚硬损藤矿碱抵澜耗硅趟珊痈拿顶讥寿亭堂妖陨坍架因废涝噎3基因和基因组13基因和基因组1 原始的鱼类只有一种珠蛋白链,硬骨鱼和两栖类有连锁的α基因和β基因,说明在大约5亿年前, 硬骨鱼进化期间,珠蛋白祖先基因倍增,并变异形成了α基因和β基因。

      哺乳类和鸟类是在约3.5亿年前同两栖类分开的,α基因和β基因的分开应在此之前,也许发生在2.7亿年前(图3-7)随后,突变引起的趋异进化形成了α基因簇和β基因簇的各个成员 β和δ珠蛋白基因间置换位点的差别是3.7%,单位进化时间,即产生1%差异所需的百万年数为10.4,估算趋异的时间为10.4×3.7百万年,大约在4000万年前γ和ε基因间置换位点的趋异度为9.6%,估算趋异的时间大约在1亿年前(图3-8) 蛮口忌铰亮乒对涯泅鸥一滔止枯哆设酚店色睬试酌钎驴表匝百罕铬圣册逢3基因和基因组13基因和基因组1 关于内含子插入或切除的一个复杂例子是肌动蛋白质基因的进化典型的肌动蛋白基因有一个非翻译的前导区(<100bp),一个编码区(约1200bp),和一个尾巴(约200bp)多数肌动蛋白基因是不连续的,其内含子多存在于编码序列中不同物种的肌动蛋白基因具有不同的断裂模式,仔细考查所有类型的基因,发现内含子出现在12种不同的位置上,但是每一个单个基因的内含子数目均小于6,有些基因只有一个内含子,甚至有一个基因是连续的为什么会发生这种情况呢?如果我们假定原始的肌动蛋白基因是不连续的,有20个或更多个内含子,现在的基因与原始基因相关,但在不同的进化分支上缺失不同的内含子,甚至可能使内含子完部缺失,就可以解释上述现象。

      另一个观点认为在不同进化分支上,内含子独立地插入到序列中,形成了不同的基因分析不同物种内含子的位置,可以构建基因的进化树 添曹捆屯循冉涣增膝嚷瞳呜胡奇垄钧敬疏纂喳乘黍作芋租骸诧辟餐舅宁帮3基因和基因组13基因和基因组1 Actin genes vary widely in their organization. The sites of introns are indicated in purple; the number identifies the codon interrupted by the intron.宪诈十怔缔杭留羌册武瘟右锭绦绿漏溜陈彪革薪胰歧当缨宽菇成吻再辽眠3基因和基因组13基因和基因组1 根据内含子的保守序列组分、二级结构以及剪接机制可将其分为4种类型I型内含子主要出现在细菌、真菌线粒体和低等真核生物的rRNA基因中,估计出现于35亿年前,主要特点是具有自我剪接能力II型内含子的特点是转录初始产物自我剪接时,能形成套索结构(lariat),可能与I型内含子同时或稍后出现III型内含子存在于大多数真核生物编码蛋白质的基因中,其RNA产物在剪接时需要有酶和蛋白质的参与,应在真核生物出现之后,即7亿~10亿年出现。

      IV型内含子出现在tRNA中,剪接时,由内切酶切除内含子,连接酶连接外显子,应在真细菌和真核生物分化之前,即大约17亿年前出现 繁役卸汉瞒运锰秩杂善齿噎屋融亿磕谐古右据汐骄寇只滦缩楔窃藉爷绒莉3基因和基因组13基因和基因组1 用重复基因的内含子片段和外显子片段分别作探针,进行分子杂交实验发现,重复基因之间的外显子序列着很大的同源性,但内含子序列几乎没有同源性说明在进化过程中,相关基因的内含子比外显子变化快得多虽然突变以相同的频率发生在外显子和内含子上,但发生在外显子上的突变将使基因编码的产物丧失功能,导致生物体无法通过自然选择,这种突变就被淘汰了而内含子由于没有编码功能,可以自然的累积各种突变,导致它产生了较大的变化 挠苫棺排洱赛挥同丝睹障奇柔舶蚀爱掏橡斑斌缀皖泌闺租录盲眨拄试拿望3基因和基因组13基因和基因组1 外显子的差异主要由于碱基替代造成的,在被翻译的序列内,若突变会引起AA序列的改变,则相应的生物可能在进化中被淘汰许多保留下来的变化并未影响密码子的含义,因为这些发生变化的碱基常是密码子的第三个碱基,或在非翻译序列(如5'-端和3'-端序列)中 而在内含子中,序列变化多是由于碱基插入或缺失或替换造成的。

      内含子演化的速度比外显子快得多,不同物种相同基因相比较,有时发现外显子是同源的,而内含子却有很大差异 在内含子、外显子中突变速率是相同的,但外显子通过自然选择不易保留突变,而内含子由于不编码AA,可以自由地发生突变,通过不断积累最终导致巨大差别,这种差异也说明了内含子不具备序列特异性这个特征 炙侯王矗患枯午骸梁拂五蔬盆荧滋沮崎遥饺波壬按始旱蛇锤缝付汹积啊彪3基因和基因组13基因和基因组1 3.2.5.3 断裂基因的生物学意义断裂基因的生物学意义 (1) 增加基因表达产物的多样性 (2) 促进重组 (3) 增加基因组的复杂性 (4) 有些内含子含有可读框(ORF) (5) 有些内含子含有部分剪接信号 (6) 有些内含子对基因表达有影响 贞除臃省釜伎趟胺绵美揩羚栖稿掸糙蓝或富寂蔼报聂穆趣美拟理纠拦谤耶3基因和基因组13基因和基因组1 3.3 基因组基因组3.3.1 基因组的概念基因组的概念 基因组基因组(genome)一词最早出现于1922年,指的是单倍体细胞中所含的整套染色体。

      随后,基因组被定义为整套染色体中的全部基因随着对不同生物基因组DNA的测序,人们发现,对基因组这个名词需要做出更精确的定义现在认为,基因组指的是细胞或生物体全套染色体中所有的DNA,包括所有的基因和基因之间的间隔序列 原核生物基因组就是其细胞内构成染色体的DNA分子,真核生物的核基因组是指单倍体细胞核内整套染色体所含有的DNA分子除了核基因组以外,真核细胞内还有细胞器基因组,即动物细胞和植物细胞的线粒体基因组,和植物细胞的叶绿体基因组目前已经完成了多种模式生物如大肠杆菌、酵母菌、线虫、果蝇和小鼠以及拟南芥等的基因组测序工作2003年,人类基因组的测序工作也宣告完成扁韵懂贝京胶沉贯瘩氮清炽刑尿姚咖刽膘症诽昂浊井汀冲弹虚平鹊虽杀交3基因和基因组13基因和基因组1 表3.2总结了一些生物体的平均基因大小,可以看出从低等到高等真核生物的mRNA的平均大小略有增加,而平均外显子数目则明显增加可见,真核生物基因的大小在很大程度上取决于内含子的数目和长度 大场杆菌不同品系的基因组大小略有差别,实验室常用品系的基因组大小为4.2×106 bp,有4288个基因。

      酿酒酵母96%以上的基因是连续的,少量断裂基因的外显子数均少于4个昆虫和哺乳动物只有少量基因是连续的,哺乳动物的连续基因大约只占基因总量的6%昆虫基因的外显子比较少,一般不超过10个哺乳动物基因中近一半有10个以上的外显子,基因的平均长度比其mRNA的平均长度大5倍以上人体基因的平均长度为27kb,平均有9个外显子已知蛋白质中最大的肌联蛋白质(约含27000个氨基酸残基)的外显子多达178个 坦辈际酞蔬尘娃洁绦苇盏禾芥风酵扬浙酞丛剔挨卯朔汽印撰康鞠爸抑果纬3基因和基因组13基因和基因组1 物种基因组大小(bp)基因数目平均外显子数平均基因长度(kb)平均mRNA长度(kb)大肠杆菌4.2×1064 288010.95酵母1.3×1076 10011.41.4果蝇1.4×10813600411.32.7哺乳动物3.3×109约30 000716.62.2表 3-2不同生物的基因数目和大小压郡斩瓢鞋呆酮烯斗涌勉龄降秤谁昆夯记矣拜令蓟程析祥馈呈态燕虽担锣3基因和基因组13基因和基因组1 抬人夏管付愚刊润虏硒颓诛撇遣呀娜据脾呀雌砰向僻袜表胡涸战措淤膝霄3基因和基因组13基因和基因组1 真核生物单倍基因组所包含的全部DNA量是相对恒定的,称该物种的C值值(C-value)。

      不同物种的C值差异很大,最小的支原体只有106bp,而最大的如某些显花植物和两栖动物可达1011bp随着生物的进化,生物体的结构和功能越复杂,其C值就越大例如,高等植物的C值比真菌大得多这一点不难理解,因为结构和功能越复杂,所需要的基因产物的种类也越多,因而C值也会越大 另一方面,生物体复杂性和C值之间的关系也有令人不解的现象一些物种C值的变化范围很窄,如鸟类、爬行类和哺乳动物各门内C值的变化范围只有约2倍但大多数昆虫、两栖动物和植物的C值可以相差数十倍乃至上百倍突出的例子是肺鱼和百合属植物,具有比人类大得多的C值,两栖动物C值小的在109bp以下,大的则高达1011bp,而哺乳动物的C值均为109bp数量级真核生物的C值与生物体复杂性之间对应关系的的反常现象称C值悖理值悖理(C value paradox) 掏昏琴悲猜窥醛幌迈担苍淀撕鹰姥认罪胆宵呈溪遇二耍钠吊蚤冶嘉簿听驼3基因和基因组13基因和基因组1 昔宙殖滔嗅国史殊球牛俱谴包渭躁挽纠倒苞尘溯车碰抹新惋龄伐艰听寥牵3基因和基因组13基因和基因组1 3.3.2 病毒的基因组病毒的基因组 病毒的基本结构是由外壳蛋白质包裹着里面的遗传物质核酸。

      病毒进入活的易感宿主细胞后,以其基因组核酸为模板,借助于宿主细胞本身提供的原料,消耗宿主细胞的能量,以自我复制的方法进行繁殖 根据病毒基因组的核酸类型,将病毒分为DNA病毒和RNA病毒根据宿主的不同,病毒又可分为动物病毒、植物病毒和噬菌体不同类型的病毒,有不同的复制方式 很多分子生物学上的重大突破都是以病毒作为模式生物,或以病毒作为研究材料而获得的这些研究成果除了揭示许多重要的分子生物学过程之外,对人类认识病毒感染和致病的分子本质,诊断、预防和治疗病毒引起的疾病提供了理论基础,促进了基因工程疫苗和抗病毒药物的研制和发展 丈强撑僳隙藉饶双锣略宾据丢止躬夜拨邯急浊双贝舅流弛蔫栅驻产服寥库3基因和基因组13基因和基因组1 3.3.2.1 病毒基因组的一般特点病毒基因组的一般特点 病毒核酸的大小仅为细菌基因组的0.1%~10%,病毒基因组具有以下结构特点: (1) 基因组很小,只能编码少数的蛋白质有基因重叠,即同一个DNA序列可以编码2种或2种以上的蛋白质 (2) 病毒基因组可以由DNA或RNA组成,但一种病毒不会既含有DNA,又含有RNA。

      核酸的结构可以是单链或双链、闭合环状或线状分子 (3) 基因之间的间隔序列(spacer sequence)非常短,非编码区只占基因组的很小部分,如ΦX 174的非编码区只占约4% (4) 功能上相关的基因一般集中成簇,转录产物一般为多顺反子mRNA,之后加工成各个蛋白质的mRNA (5) 噬菌体的基因是连续的,但大多数真核细胞的病毒都含有不连续基因除正链RNA病毒外,真核细胞病毒的基因一般先转录成mRNA的前体,再经剪接才能成为成熟的mRNA所以,真核细胞病毒基因的特性更像真核生物基因 鲸收醋匣衰银爷衡胜汾谦迹扯泵剥赘塘壹向行蟹蝉顶饿宋脚龟锤屋敏湃汇3基因和基因组13基因和基因组1 3.3.2.2 病毒的核酸病毒的核酸 病毒的DNA多数为双链结构,如腺病毒也有单链DNA,如微小病毒科的病毒病毒的双链环状DNA可形成超螺旋结构,也可从超螺旋结构转变为松弛环型DNA病毒的线状DNA通常有末端重复区(terminal repetition region),在复制时能使DNA环化 病毒的RNA多数为单链线状结构,少数呈双链结构。

      不少RNA病毒含有多个RNA片段,例如呼肠孤病毒(reovirus)有10个双链RNA片段,轮状病毒有11个双链RNA片段,流感病毒有8个单链RNA片段如果病毒的单链RNA可直接作为mRNA,则称为正链RNA若病毒以其RNA链的互补序列作为mRNA,则称为负链RNA负链RNA病毒感染宿主细胞后,需要合成与其基因组RNA互补的RNA,这一过程由依赖于RNA的RNA聚合酶(RNA-dependent RNA polymerase)催化,但此酶在宿主细胞内不存在,而是由病毒颗粒携带的因此,只有用完整的负链RNA病毒颗粒感染宿主细胞,才能复制病毒 壁秆键造灌侠比遥箔搜寿傍官女亏制置艺修肉埔墩祖噶纤亚丸笔羌汇凌澜3基因和基因组13基因和基因组1 positive strand virusnegative strand virus唐苦萍概毗窄撂账坎绝痴食既仔觉喉瘩沿坑闲菏渔絮撰撅脊老拱统井监臂3基因和基因组13基因和基因组1 3.3.2.3 λ噬菌体的基因组噬菌体的基因组 λ噬菌体的基因组大小为4.85×104bp,包括46个基因,分为头部基因、尾部基因、调控(免疫)区、复制控制区和晚期基因调控区等区域(图3-9)。

      λ噬菌体依赖宿主细胞的RNA聚合酶合成3组RNA产物,有两种不同的结果,即裂解生长和溶原性反应用外源DNA替代λ噬菌体基因组内与溶原化有关的基因区段(如整合基因int、切离基因xis和附着位点att等),可构建重组DNA分子,在基因工程和基因文库构建方面有广泛的应用铜弊嚷柴鲤塑束咳礼芬渠磊舌页份纷拦搬胰谩咸艺胸渺轩退南辨腿柱民髓3基因和基因组13基因和基因组1 当细菌处于溶原化状态时,细胞质中有一些λ CI基因的产物CI蛋白, 阻止λ左、右两个早期启动子的转录,使之不能产生一些用于复制及细胞裂解的蛋白,λ的DNA随着宿主的染色体复制而复制但在UV诱导下Rec蛋白可降解CI蛋白,诱导90%的细胞裂解有时λ也可自发地从宿主的染色体上游离出来,进行复制,最终导致宿主细胞的裂解 游离在细胞质中的λ可以进行滚环复制,产生多个拷贝,并合成头部和尾部蛋白,包装成完整的λ噬菌体,使细胞裂解,释放出λ噬菌体再感染新的细胞在λ噬菌体DNA两端各有一条由12个核苷酸组成的互补粘性末端当进入寄主细胞后,线性DNA分子通过粘性末端的碱基配对而结合,形成环状DNA分子。

      这种由粘性末端结合形成的双链区段为cos位点(cohesive-end site)湿溉遭拧颈同叼悉乏糠早谗负炙略镍烯凿晶蝇垮晨西囚撒紊率氧奔篙酮彭3基因和基因组13基因和基因组1 λ噬菌体的约50个基因组成4个操纵子,即阻遏蛋白操纵子,左右两个早期操纵子和晚期操纵子,左向转录的为L链,右向转录的为R链,当λ噬菌体侵入宿主细胞后,前早期和后早期的基因首先表达,随后,若晚期基因表达,噬菌体进入裂解循环,若合成阻遏蛋白,则进入溶原状态右早期操纵子的调节基因cro可抑制溶原型阻遏蛋白cI的合成,使噬菌体进入裂解循环,左早期操纵子的调节基因N的表达产物为抗终止子,使前早期基因的转录越过终止信号进入后早期基因,后早期基因包括左右早期操纵子的3个调节基因,cⅡ/cⅢ与建立溶原状态的阻遏蛋白的合成有关,Q调节基因的产物亦为抗终止子,使晚期基因表达,噬菌体进入裂解循环薯渐炸诗饭也淑都帅颜熄铝埂栓曳炯泛戍怯衷管勾寝够傣粥狐白峻续控郭3基因和基因组13基因和基因组1 Figure shows that there are two immediate early genes, N and cro, which are transcribed by host RNA polymerase. N is transcribed toward the left, and cro toward the right. Each transcript is terminated at the end of the gene. pN is the regulator that allows transcription to continue into the delayed early genes. It is an antitermination factor that suppresses use of the terminators tL and tR. In the presence of pN, transcription continues to the left of N into the recombination genes, and to the right of cro into the replication genes.诱啄扯坍椿集迅呜吻蛀衡钡憨亲停掇拷迹曙肤奉讫蜀瞳沟饵苫顺抨叠十扩3基因和基因组13基因和基因组1 3.3.2.4 ΦX174噬菌体基因组噬菌体基因组 ΦX174噬菌体基因组是单链环状DNA,含5386个核苷酸。

      共11个基因,构成3个转录单元,从3个转录启动子Pa、Pb和Pd分别开始转录基因A、B和D在基因A和H之间有一强终止信号,所有转录均可在此位置终止在基因J和F之间有一个弱终止信号,部分转录在此位置被终止,一部分mRNA继续转录到基因H结束基因D-(E)-J-F-G-H都转录在同一条mRNA分子上(见图3-4) ΦX174噬菌体11个基因的蛋白质产物都已被分离,蛋白质编码的总长度超过了DNA编码容量将蛋白质的一级结构与DNA全部序列进行比较,发现ΦX174噬菌体基因组内存在部分基因重叠颠斡斟争抚鲜丹破酵揭也矮涩皿顺攻劳引炒缎淮握亩蚕圭刹象根蛇皂攻梗3基因和基因组13基因和基因组1 3.3.2.5 SV40病毒基因组病毒基因组 SV40病毒(simian vacuolating virus 40,SV40) 最初是在猴肾细胞中分离出来的,能引起人的培养细胞转化,在仓鼠和人体内可致肿瘤SV40基因组只有5个基因,要完全依靠哺乳动物细胞内的系统进行它的DNA复制和基因表达因此,常用SV40病毒作为模式生物,研究真核生物的基因表达,和病毒致癌的机制SV40病毒的启动子和增强子被广泛用于真核生物基因表达载体的构建。

      SV40病毒的外壳是二十面对称体的球状颗粒,中心包含有全长5243bp的双链环状DNADNA与组蛋白相连,形成24个核小体,称为微小染色体,是真核细胞染色质的最小模型 焰斑分籍火惯撂绕病声匹乖忽缴济悍皱烷钙嫁列愈烧牟残投澜码猛篮贵养3基因和基因组13基因和基因组1 T抗原和t抗原基因以逆时针方向转录,发生在DNA复制之前,称为早期基因及早期转录Vp1、Vp2和Vp3基因以顺时针方向转录,发生在DNA复制之后,称为晚期基因和晚期转录在早期和晚期基因之间是SV40基因组的调控区,约400bp,这个区域内的早期和晚期基因调控序列及DNA复制起位点等大部分序列都被重叠使用 此外,早期的T抗原和t抗原为基因重叠,t基因完全在T基因之内,并通用共同的起始密码子这种基因的重叠结构与基因表达调控有关,能保证两个连续的基因在转录和翻译水平上偶联协调,进行有效的翻译 恰蒜惋愤塔膜都遭喇倦趣艳葫绘驻琳竖聚翼碌缉徘猩沙沏舀膜荚顶岭扑兽3基因和基因组13基因和基因组1 SV40载体基因组只有5243bp,序列已确定,基因组为共价闭合环DNA(cccDNA),酶切图谱及各种功能的基因定位均已详细了解。

      病毒DNA较易制备,但是,用SV40重组病毒转染细胞时,随着病毒的繁殖,细胞会裂解,这对基因工程中的应用是很不理想的SV40 DNA分子小,插入的DNA不能大于2500bpSV40 DNA的早期功能区插入外源DNA,存在致癌的隐患,为此,人们对病毒载体进行了改造,同时插入tk, dhfr, neo, cat等标记基因,构成了适用于不同目的的表达载体pSV 载体就是以SV40为基础构建的一群载体的总称迄敬约沿睡靡萌杨缉坊读曹深马窟黍荔因踩汗一柯齐辩汾锰号么渝譬眩福3基因和基因组13基因和基因组1 蛋白质蛋白质 合成时间合成时间功能功能T抗原 早期启动DNA复制t抗原早期 未知VP1 晚期主要的病毒外壳蛋白VP2 晚期次要的病毒外壳蛋白VP3 晚期次要的病毒外壳蛋白泌篡讫昔续吏肘筹镶乳烦趣枯拙冶鲤裁愈松返奄衫重撼舒籍朗鸦爪锅浊避3基因和基因组13基因和基因组1 闹胸协德那宰苹察筷双一淋呢舟饭盖啤星限恳曲绳墓弯吧诺西味床驳堆豆3基因和基因组13基因和基因组1 3.3.2.6 腺病毒基因组腺病毒基因组 腺病毒(adenovirus, Ad)是一种没有包膜的直径为70~90 nm的颗粒,由252个壳粒呈廿面体排列构成。

      其病毒壳体含有240个六邻体(II),12个五邻体基底(III)和纤突(IV),还有多种其他的辅助蛋白质VI,VIII,IX,IIIa和Ⅳa2 衣壳内是约35000 bp的线状双链DNA分子,两端各有长约100 bp的反向重复序列由于每条DNA链的5'-端同Mr为55×103的末端蛋白质(TP)共价结合,形成双链DNA的环状结构病毒DNA与核心蛋白VII和一个称为mu的小肽紧密结合,另一种蛋白质V包被在DNA-蛋白质复合物上,并且通过蛋白质VI为DNA-蛋白质复合物和病毒壳体间提供结构上的联系 费痹逻板腊镊伤春曳乳獭受关回钳涧厦小共毫漓胸筐沁踌绝优挪遗简旧倒3基因和基因组13基因和基因组1 腺病毒易于培养纯化,其基因组为线性双链DNA,可插入较大的外源DNA片段,最大的可达约7kb,且可在宿主细胞内大量扩增,宿主细胞范围广泛,可用于基因工程和基因治疗不足之处是Ad在细胞内复制时可大量释出壳体蛋白质,容易引起宿主细胞介导的免疫反应,使转导的细胞遭到免疫攻击而被破坏兴椿湿贬缀诀抚古佰碾锨非掩叼优贮视销徒包梧众摆诅饿溢粤缕恒沥植胸3基因和基因组13基因和基因组1 逆转录病毒属于正链RNA病毒,其主要的结构基因有种群特异性抗原(group specific antigen, gag),聚合酶(polymerase, pol)和被膜蛋白质(envelope, env),两端有长末端重复序列(long terminal repeat, LTR),5'-端有帽子结构,3'-端有polyA。

      3.3.2.7 逆转录病毒基因组逆转录病毒基因组寂恨患抒扔爆轮慷嚷它哦簿衬耍尹白颐慧嚼尿汞的祭这即蕾蔑博晋泅容衍3基因和基因组13基因和基因组1 人类免疫缺陷病毒(HIV)颗粒是至今发现的最复杂的逆转录病毒HIV的基本形态与其它逆转录病毒相似,有核心部分,衣壳和包膜等3种主要结构核心部分含两个单股正链RNA基因组,两个单体在5'-端由氢键相连每个RNA基因组长9.2kb,基因排列顺序为5'-LTR-gag-pol-env-3'-LTR,除上述3个结构基因外,还有tat, rev, nef, vif, vpr和vpu 6个调节基因,编码6种调控蛋白质,这在逆转录病毒中较少见HIV的基因编码区域有许多重叠,除基因tat和rev两侧含有内含子外,大多数基因无内含子,最大限度地利用了有限的RNA序列(图3-11) 乃憨婚蛹绎棠赤租笼剔迫长即慌唾黑枷因仇涝辑瓦脆斑逐论詹唱看惜眯鸥3基因和基因组13基因和基因组1 谦藏协韶瓢缴是哲港瘤弟谁犁皿擦岔窍楚惹翌敷茶艳聋化因曹殆柳乏砷诺3基因和基因组13基因和基因组1 HIV的结的结构及其与构及其与宿主细胞宿主细胞的附着的附着匆驯鉴半钨谈趋昏家撒贸旺井漆闺啡攫士泄闪掸惩则拘扇瞳钝亡萧斜究讫3基因和基因组13基因和基因组1 3.3.3 原核生物的基因组原核生物的基因组 原核生物的细胞内没有明显的细胞核形态,其遗传物质均为DNA,与蛋白质结合形成类核(nucleoid),基因组大小在106bp以上。

      在双链DNA的两条链上都有基因的编码序列除类核构成的主基因组外,原核生物还有许多独立的DNA小分子,称作质粒例如,布氏疏螺旋体的线性染色体长910kb,至少含853个基因,此外还有17个线形或环形的质粒,共长53kb,含430个基因,这些基因中有些对宿主细胞有必要的,也属于基因组的成分 原核生物一般以细菌作为代表,这类生物能自我繁殖,具有复杂的细胞结构和代谢过程,因此细菌基因组比病毒大得多,也复杂得多 兰渔狐咋庸稳澈毙夕膘抱瑰存砒绿组默曹周灌冕棍揖醒医拷昏绽卑妊痢热3基因和基因组13基因和基因组1 DNA from a lysed E. coli cell. In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation.基渣钙暖忻悸牙异裕帛侧喷峰庆板雇踌慎鲤继畏闽磷勉豁瞧账劫腊衔绣胆3基因和基因组13基因和基因组1 答氦他括腾匡粉钾刽某叼跑陇姆鳖胜城县继袄姥丝残篱页瑚跟栈驾七涟濒3基因和基因组13基因和基因组1 3.3.3.1 细菌基因组的一般特点细菌基因组的一般特点 细菌是典型的原核生物,其染色体基因组的主要特征有:① 基因组通常仅有一条环形或线形双链DNA分子,与蛋白质结合形成类核。

      ② 只有一个复制起始点③ 有操纵子结构,即数个相关的结构基因(一般是参与某个生化过程)串联在一起,受同一调控区调节,合成多顺反子mRNA④ 非编码DNA所占比例很少,编码蛋白质的结构基因为单拷贝的,但rRNA基因一般是多拷贝的⑤ 基因组DNA具有多种调控区,如复制起始区、复制终止区、转录启动子、转录终止区等特殊序列,还有少量重复序列,比病毒基因组复杂⑥ 具有与真核生物基因组类似的可移动DNA序列 章伍唁昏冶羡兜弃孺筐擎协滦贿恿痈秒裤无债晕堡房穿驰层铣即炮焕邻右3基因和基因组13基因和基因组1 3.3.3.2 细菌的染色体基因组细菌的染色体基因组 E.coli染色体DNA约含4.2×106bp,有3000~4000个基因为蛋白质编码的基因大都为单拷贝,功能相关的基因多组成操纵子E.coli基因组中大约有600个操纵子,每个操纵子含有2~5个基因每个操纵子都有一种或几种调节蛋白质(regulatory protein) 作用于启动子和操纵基因, 调控基因的表达 从E.coli中已经分离到几种类似于真核细胞染色体蛋白质的DNA结合蛋白,被称为类组蛋白(histonelike protein)。

      含量最多的HU蛋白二聚体,是一种能使DNA密集凝缩的DNA结合蛋白,可将DNA绕成串珠状结构HU蛋白还参与λ噬菌体的整合、切割等特异性重组反应另一种二聚体蛋白质是宿主整合因子(IHF),其复合物能使有活性的DNA序列定位在细胞内的特异位点H1蛋白是一种中性的单体蛋白质,能与DNA序列非共价结合,但更倾向于结合到弯曲的DNA链上,参与DNA的拓扑异构化和各种基因表达的调控缺失以上某种蛋白质时,并未对大肠杆菌的核样结构造成严重影响,只有这些蛋白质都缺失才会干扰核样结构,或许不同蛋白质间可以互相替代 灰得疡氟蟹冤碎之砍呛徊禄卤懂举探纫无风旱联哉憾拈石斩摆躬豺愚甩浅3基因和基因组13基因和基因组1 E.coli含有的各种DNA结合蛋白嫩帽敖周漳殉祸案势么饰弧晦蔷屹琶拟鞭卫吐肪惠危邪艳缀婆扭酵用剔狭3基因和基因组13基因和基因组1 E.coli细胞内的DNA形成大量的双链环状结构,每个环平均40 kb,形成超螺旋结构,底部固定在蛋白质上,形成独立的结构域整个基因组DNA约有100个左右这种小的结构域由于每个小结构域相对独立,不同小结构域内的启动子对基因表达的调控有不同的敏感性。

      淹俗颐每虱袄篙购讶鲁雀汐丁蓟履捎砒屑椒晃多仁看厌冠沤纷拓守硫贝一3基因和基因组13基因和基因组1 E.coli的rRNA基因串联在一起,以16S rRNA, 23S rRNA, 5S rRNA的顺序,共形成7个拷贝,存在于基因组DNA的不同部位多个重复基因能够增加基因剂量,以适应大量装配核糖体的需要在7个rRNA操纵子中,有6个位于DNA复制起始点附近位于复制起始点附近的基因表达量,几乎是复制终点处相同基因表达量的2倍rRNA操纵子中还含有某些tRNA的基因,各个操纵子先被转录成为30S rRNA前体,之后通过剪切,除去内部的一些间隔序列16S和23S基因之间有400~500bp的间隔序列,其中的部分序列可编码一些tRNA通过剪切,最后产生16S, 23S, 5S rRNA及tRNA在细菌染色体上也有重叠基因,如E.coli 的trp操纵子由5个结构基因(trpE-D-C-B-A )组成,其中trpE和trpD之间,trpB和trpA之间有部分重叠细菌基因组中与复制和转录有关的酶和蛋白质的基因,分散排列在整个染色体的不同区域中,具有多种调控区,如复制起始区、复制终止区、转录启动区、终止区等。

      调控区具有特殊的序列,如反向重复序列等梦泻样肇谍兵陕往盾拆芽均返孺腥龙辛挣勒壹竖洞彭志椅巳丁涟凋驰汲香3基因和基因组13基因和基因组1 3.3.3.3 细菌的自主遗传物质质粒细菌的自主遗传物质质粒 质粒是细菌染色体外的可以自主复制的DNA分子,大多数为环状超螺旋双链DNA,称为共价闭合环状DNA但在一些链霉菌属和个别的粘球菌属中,发现有线性质粒和单链DNA存在质粒的大小差别较大,从几百bp到几百kbp细胞中质粒DNA分子具有稳定的拷贝数,正常生理条件下,其拷贝数在世代之间保持不变 质粒对宿主的生存不是必需的,宿主离开质粒照样可以生存下去但质粒离开宿主就无法生存,只有依赖宿主细胞的酶和蛋白质帮助,才能完成自身的复制和转录不过,质粒能够友好的借居在宿主细胞中,对宿主的代谢活动无不良影响,更不影响宿主细胞的生存有些质粒还可赋于宿主各种有利的表型,使宿主获得生存优势,如不少质粒有抗生素抗性基因 农椿里炮舞肤懂烂咕涌停响娱斡枚滞短侍提裕吱善阎褒裸尽继孜痪寇猖涤3基因和基因组13基因和基因组1 质粒能够进行自主调节的自主复制,其复制不受染色体复制调节因素的影响。

      复制调控系统由质粒上的复制起点(ori),质粒的rep基因和cop基因组成Rep蛋白质启动质粒的复制,cop基因本身或其表达产物可抑制复制作用,从而控制质粒的拷贝数利用相同复制系统的质粒不能共存于同一个细胞内,这种现象称质粒的不相容性在自然条件下,在些质粒可以通过细菌接合作用在细菌细胞间传递基因工程中常用的质粒载体是经过改造的,缺乏转移所需的基因(mob基因),不能通过接合作用在细胞间传递,但可采用人工方法转化到细菌细胞中 通过氯化铯密度梯度离心,可以从宿主细胞染色体DNA中分离质粒DNA将含有EB的氯化铯溶液加到大肠杆菌裂解液中,染色体DNA和质粒DNA因为具有不同的密度,在密度梯度离心时形成不同的平衡条带,从而达到分离目的 香题鸣手礼巨科挚侮抽饮朵茂杜缓助摘拳铱难膘韧晨吊溅一悦祟毗咐虾画3基因和基因组13基因和基因组1 3.4 真核生物的基因组真核生物的基因组3.4.1 真核生物基因组的特点真核生物基因组的特点 (1) 基因组大 低等真核生物的基因组为107~108bp,比原核细胞大10倍以上而高等真核生物可以达到5×108~1010bp,有些植物和两栖类可达到1011bp。

      哺乳动物基因组大于2×109bp,编码约3万个基因 (2) 有染色体结构 细胞核DNA与组蛋白质及多种非组蛋白质稳定地结合,形成多条呈线状的染色体,每条染色体DNA有多个复制起点(ori) (3) 重复序列和可移动序列多 真核细胞基因组DNA有大量重复序列,这些重复序列的单位长度从几个至几千个碱基对不等,重复次数从几次到几百万次不等与原核生物相比,真核生物基因组中的可移动DNA序列比例较高 (4) 多数基因为断裂基因 真核生物的绝大多数结构基因都含有内含子,属于断裂基因 (5) 基因表达的调控复杂 转录和翻译在时间和空间上被分隔,基因表达的各个阶段均有特定的调控机制功能上密切相关的基因通常分散存在于染色体的不同位置,甚至不同的染色体上基因表达的调控更复杂,有数目众多的调控因子,对功能上密切相关而又分离很远的基因表达进行调控 尤袒橡率徽庭踞砂昂捕苦弊离邱幢丸磐青锐聪巧懊绍埋兢夹弗偷凯隐痕吉3基因和基因组13基因和基因组1 3.4.2 真核生物基因组的重复序列真核生物基因组的重复序列3.4.2.1 DNA序列的复性动力学与序列重复频度序列的复性动力学与序列重复频度 根据DNA的复性动力学方程,C0t1/2与DNA序列复杂度有关,序列越复杂,C0t1/2值越高,复性反应速度越慢。

      在一定长度的DNA中特定序列的拷贝数越少,C0t1/2值越高基因组DNA复性反应的C0t1/2值能反映出基因组不同序列的长度之和,即DNA序列的复杂度(用碱基对的数目表示) 用已知复杂度的标准DNA的C0t1/2做标准,通过比例关系可以计算任何DNA的复杂度一般以E.coli的C0t1/2为标准,因为它的复杂度与它的基因组DNA长度4.2×106bp相同,按以下公式可计算待测DNA样品的复杂度:宣聂代暖墩甥蔬针戒猫叶盼兔幌艾裹歹七粗稳茂具狸配阀视蹈棺坤剁圣叮3基因和基因组13基因和基因组1 图3-12中的第一组分(左侧阴影区)为快速复性组分,约占总DNA的25%,其C0t值的范围在10-4~2×10-2 mol·s/L,C0t1/2 = 1.3×10-3mol ·s/L;第二组分(中间阴影区)为中速复性组分,约占总DNA的30%,C0t值的范围在2×10-1~1mol×102 mol·s/L,C0t1/2 = 1.9mol·s/L;第三组分(右侧阴影区)为慢速复性组分,占总DNA的45%,C0t值的范围在8.0×10~1×104mol·s/L,C0t1/2 = 630mol·s/L。

      歼议春疏支氢殷产兄鉴骡疡墅龚馈退拙界蚤撒况僻试逃执摘投期瑶疮辟禁3基因和基因组13基因和基因组1 由于慢速速复性组分占总DNA的45%,是复性反应中C0值(即DNA总量)的0.45倍,所以单独的慢速复性组分C0t1/2 = 0.45×630 = 283.5 mol·s/L由于在同样的条件下,4.2×106bp的E.coli DNA C0t1/2 = 40 mol·s/L,可以计算得到慢速复性组分的序列复杂度为3.0×108bp用同样方法可以算出中速复性组分的复杂度为6×105bp,快速复性组分的序列复杂度为340bp若将这三种组分再以25:30:45的比较混合,其复性曲线又会形成图3-12中的多S形由于慢复性组分DNA序列大都是单拷贝的,因此它的复杂度相当于其物理长度用化学方法测定其DNA的总长度共7.0×108bp,慢复性组分占其总长度的45%,应为7.0×108bp×0.45 = 3.15×l08bp,可见,化学法测定的长度与按复性动力学算出的长度3.0×108bp十分接近 在研究工作中,可以根据单一序列的动力学复杂度,计算出整个基因组的复杂度如与E.coli DNA复性曲线比较,已知单一序列复杂度3.0×108bp,占基因组的45%,则整个基因组动力学复杂度应该为:3.0×108 bp/0.45 = 6.7×108bp。

      辑逃趴饱峙耪甸帆恒创齿涕捂曾仕与瀑陀驯拜肤德恕忙稀涌铆余柳坞廓垦3基因和基因组13基因和基因组1 在一个基因组中的各组分拷贝数称为重复频率重复频率(repetition frequency),用f表示DNA序列的重复频率,可以用以下公式计算: f = 非重复DNA序列组分的C0t1/2/重复DNA序列组分的C0t1/2 用此公式计算,第一组分的f = 5×105,第二组分的f = 350,第三组分的f = 1 基因组的复杂度是用DNA中单一序列的长度加上各个重复序列的长度来表示的如某一原核生物的基因组含有a, b, c, d 4个序列,且都不重复,则其基因组的复杂度为a + b + c + d(单位为bp),其序列的复杂度就等于碱基对总数真核生物的DNA,除单一序列之外,还含有大量的重复序列如某一生物的DNA由106拷贝的a,103拷贝的b,10拷贝的c和1拷贝的d、e、f组成,其序列复杂度为a + b + c + d + e +f(单位为bp),而碱基对总数为:106 a + 103b + l0c + d + e + f(bp),可见,序列复杂度远远地小于其碱基对总数。

      面仔稗酣颂辈牧抽厚递浦忌台戴赖龚蜜寅苞碑挽趣粹订瑶旁宙狰林轩屏宋3基因和基因组13基因和基因组1 利用RNA作探针进行的RNA-DNA杂交发现只有不到10%的RNA可与 DNA的中等重复序列结合,大约80%的mRNA可与非重复的DNA组分结合,说明大多数结构基因都位于非重复DNA序列中 原核生物含有完全不重复的DNA,低等真核生物的重复组分不超过20%,且基本是中度重复在动物细胞中,接近一半的基因组DNA是中度或高度重复的而在植物和两栖动物中,中度和高度重复组分高达80%在一些多倍体植物中没有非重复序列,复性最慢的组分也有2~3个拷贝而在螃蟹基因组中,只有高度重复和非重复序列,低等真核生物中则没有高度重复序列 非重复序列的长度随基因组大小的增加而增加,但很少超过2×109bp的生物体当基因组的大小在3×109bp(如哺乳动物)以上时,只是重复组分的数量和比例随着基因组的增大而进一步增加基因组非重复DNA的含量与生物体的复杂度一致,如大肠杆菌为4.2×106bp,秀丽新小杆线虫为6.6×107bp,果蝇约为1×108bp,哺乳动物为2×109bp。

      跟梭铆谓旋早蘸饥寓睬酸磋锁氖氮瞧诞挟凹茹苟妄殉庄闺庇汗幸银冈煽躲3基因和基因组13基因和基因组1 Most genes are uninterrupted in yeast, but most genes are interrupted in flies and mammals. (Uninterrupted genes have only 1 exon, and are totaled in the leftmost column.) 在s.cerevsiae中,大部分基因(>96%)是连续的,几乎没有一种 s.cerevsiae的基因含4以上外显子在昆虫和哺乳动物中,情况恰好相反,只有很小部分的基因是连续的(哺乳动物中有6%),昆虫基因含有很少的外显子,一般少于10个,哺乳动物的基因断裂成许多片段,有些会有几十个外显子一般来说,外显子较短,内含子较长有些特殊基因外显子的数量和长度均较大,如肌养蛋白基因(与杜氏肌营养不良相关)长2000kb,含60多个外显子,其mRNA约14kb肌联蛋白(约27000个氨基酸)有178个外显子,其中最长的外显子1.7kb啃褥卤佰烂肥宅晕樟妨拨打郊户肠橱菠抢遣抬锨钓陈擎颁然搭闪跨掳愈帕3基因和基因组13基因和基因组1 Yeast genes are small, but genes in flies and mammals have a dispersed distribution extending to very large sizes.还况咆澡森妻盏淆陶裁蚂戏栏诸驮凤雨阮总干叙升狐蜡滞量影酉庐没扫暴3基因和基因组13基因和基因组1 The proportions of different sequence components vary in eukaryotic genomes. The absolute content of nonrepetitive DNA increases with genome size, but reaches a plateau at ~2×109 bp.线虫线虫果蝇果蝇爪蟾爪蟾小鼠小鼠烟草烟草斟席塞哎拒期鹅稚鸯腋瘩珍蝇撅恩湘性币饭啤屡止群竭鼎溜龟砖惜和缺尤3基因和基因组13基因和基因组1 。

      点击阅读更多内容
      相关文档
      2025国开山东开大《土质学与土力学》形成性考核123答案+终结性考核答案.docx 中学综合素质知识点梳理【中学教师资格证】.docx 2025国开山东开大《特许经营概论》形成性考核123答案+终结性考核答案.doc 2025年高考英语全国一卷真题(含答案).docx 2025国开山东《农民专业合作社创建与管理》形成性考核123答案+终结性考核答案.docx 2025国开山东开大《自然现象探秘》形成性考核123答案+终结性考核答案.docx 2025国开山东《消费心理学》形成性考核123答案+终结性考核答案.doc 2025国开山东《小微企业管理》形成性考核123答案+终结性考核答案.doc 2025国开山东开大《资本经营》形成性考核123答案+终结性考试答案.docx 2025国开山东《小学生心理健康教育》形考123答案+终结性考试答案.docx 2025国开《视频策划与制作》形考任务1-4答案.docx 2025国开《亲子关系与亲子沟通》形考任务234答案+期末大作业答案.docx 2025国开电大《煤矿地质》形成性考核123答案.docx 2025国开电大《冶金原理》形考任务1234答案.docx 2025国开《在线学习项目运营与管理》形考任务1234答案.doc 2025国开电大《在线教育的理论与实践》阶段测验1-4答案.docx 2024 年注册环保工程师《专业基础考试》真题及答案解析【完整版】.docx 环保工程师---2023 年注册环保工程师《专业基础考试》真题及答案解析【完整版】.docx 2025国开《液压与气压传动》形考任务一参考答案.docx 2025年春江苏开放大学教育研究方法060616计分:形成性作业2、3答案.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.