
分子生物学:12-真核生物基因表达的调控.ppt
156页第第12 章 真核生物 基因表达的调控 化学工业出版社化学工业出版社 多细胞真核生物的每一个体细胞中都有相同的遗传物质,然而,只有一小部分的遗传信息在不同细胞中得以表达正是因为在特定时间和空间,不同基因在表达水平上的精确调控,导致了各种细胞的千差万别 真核生物基因表达的调控是一个多层次的、多级的过程,涉及到染色质中基因的活化、基因的转录、转录产物的加工、蛋白质合成及其产物的剪切与修饰等,这些表达的准确性与协调性是细胞生命活动所必不可少的因此,真核生物采取了不同于原核生物的更加复杂而精细的调控策略 真核生物基因表达的调控,是当前分子生物学中最活跃的研究领域之一掌握真核生物基因表达的调控,对于理解真核生物生命活动的规律有重要意义同时,对于更好地控制作物的生长发育,用更好的方法治疗心血管疾病和肿瘤等非传染性疾病,更好的用真核生物表达目的基因有显而易见的促进作用 12.1 真核生物基因表达调控的特点真核生物基因表达调控的特点 真核生物细胞结构比原核生物复杂,核膜将细胞质和细胞核分开,从而导致转录和翻译在时空上的分隔核内进行基因的转录及其加工,胞质进行翻译,并且真核生物基因组和染色体结构复杂,基因组DNA以核小体的形式存在,蕴含大量的调控信息,因此真核生物基因表达的调控要比原核生物复杂得多。
另外,真核生物基因表达可随细胞内外环境条件的改变及生长发育的不同阶段而呈现精确的调节,即真核生物基因表达的调控可以发生在基因表达的任何环节,包括染色体和DNA水平、转录水平、转录后水平和翻译水平等多层次的调控 12.1.1 原核生物和真核生物基因表达调控的差别原核生物和真核生物基因表达调控的差别 (1) 原核生物的DNA不与蛋白质形成核小体结构,也没有核膜将基因转录和翻译隔离开来,基因转录和翻译相互偶联,而且mRNA的半衰期很短,一种mRNA必须持续转录才能维持蛋白质的合成,因此原核生物基因表达的调控主要在转录水平而真核生物形成了以核小体为单位的染色质结构,出现了染色质结构对基因表达的调控作用,尤其是核膜的存在,把基因的转录和翻译分别分隔在细胞核和细胞质中进行,使它们在时空上得以分开,而且转录和翻译产物还需要经过复杂的加工与转运过程,从而形成了真核生物基因表达调控的多层次性 (2) 无论原核生物还是真核生物,基因表达调控的机制都包括正调控和负调控,原核生物以负调控为主,而真核生物以正调控更为常见,这与它们染色质的结构有关真核生物与组蛋白形成核小体和染色质结构,使得RNA聚合酶难以发现启动子序列,因而常态下的真核生物基因表达处于非活化状态。
只有在各种激活蛋白的帮助下,使RNA聚合酶和转录因子能够接近启动子序列,才能启动基因的表达真核生物的基因转录表现为独立模式,即一个基因产生一个单顺反子mRNA(秀丽隐杆线虫是目前发现唯一的例外),而原核生物中可由一组基因产生一个多顺反子mRNA (3) 真核生物的基因数目比原核生物多,而且大多数基因都有内含子,还存在大量的重复序列如人类细胞基因组约有DNA 3.3×109bp,约为大肠杆菌总DNA的700倍,其中约2.9×109bp为常染色质,人类基因组含2.0~2.5万个基因,与蛋白质合成有关的外显子序列仅占1%原核生物蛋白质的长度较真核生物小,如大肠杆菌蛋白质的平均长度是317个氨基酸,达500个氨基酸大小的蛋白质极少,而真核细胞中约1/3蛋白质具有500个氨基酸 (4) 真核生物基因表达调控不仅受细胞内外环境的影响,还要随发育的不同阶段表达不同的基因,前者属于短期调控或称可逆调控,后者属于长期调控或称不可逆调控,决定真核生物细胞生长分化的发育进程 一个典型的细菌DNA可编码约3000种多肽,其中约1/3在特定时间表达而一个典型的哺乳动物细胞约含有2 万~2.5 万编码蛋白的基因,由于选择性剪接,可合成5万~6 万种蛋白质。
真核生物细胞有大量的DNA和大量的蛋白质需要组装,所以真核生物基因表达是一个复杂的过程细胞不仅要从染色体上找出这些基因,还要调控这些基因表达的水平由于蛋白质的合成包括许多步骤,因此需要分级进行调控(图12.1) 12.1.2 真核生物基因表达调控的层次真核生物基因表达调控的层次12.2 染色体水平的调控染色体水平的调控 12.2.1 异染色质化对基因活性的影响异染色质化对基因活性的影响 真核生物细胞在有丝分裂完成之后,大多数高度压缩的染色体要转变成间期的松散状态,这些区域构成常染色质常染色质但是,大约有10%的染色质仍然保持压缩状态, 无转录活性,称异染色质异染色质异染色质高度压缩,所以异染色质区的基因转录处于被抑制状态,而常染色质区的基因具有转录活性结构异染色质结构异染色质(constitutive heterochromatin)在整个细胞周期内都处于凝集状态,即永久性的呈现固缩状态,多定位于着丝粒区、端粒区,含有大量高度重复顺序的DNA,即卫星卫星DNA兼性异染色质兼性异染色质(facultative heterochromatin) 只在一定细胞类型或一定发育阶段凝集,如雌性哺乳动物含一对X染色体,其中一条始终是常染色质,但另一条在胚胎发育的第16~18天变为异染色质,只有一条X染色体具有活性,这些使得雌、雄动物之间虽X染色体的数量不同,但X染色体上基因产物的剂量是平衡的。
雌性的三色猫是一个X-连锁基因杂合体,X-连锁的b基因控制橙色毛皮,其等位基因B是控制黑色的毛皮带有b基因的X染色体若失活,B基因表达产生黑色毛斑,若带有B基因的X染色体若失活,b基因表达则产生橙黄色毛斑因此,其腹部的毛是白色的,背部和头部的皮毛由桔黄色和黑色斑组成12.2.2 组蛋白对基因活性的影响组蛋白对基因活性的影响12.2.2.1 组蛋白和核小体组蛋白和核小体 用微球菌核酸酶切断真核生物的DNA可获得独立完整的核小体核小体,它由核小体核心和连接区(linker DNA)组成,通常含有200个碱基对的DNA和9个组蛋白分子核小体核心由组蛋白H2A、H2B、H3、H4各2个分子形成八聚体, 146个碱基对DNA在八聚体上缠绕近2圈,其DNA不易被核酸酶消化核心组蛋白均由三个α-螺旋和两个环组成,N端形成向外自由伸展的尾状结构(图12-2a)连接区的DNA结合组蛋白H1,封闭了核小体核心(图12-2b) H1数量相当于核心组蛋白的一半,所以很容易从染色质中抽提出来一连串核小体呈螺旋状排列构成直径30nm的纤丝,使DNA的长度压缩40倍(图12-2c)。
纤丝再进一步压缩成为常染色质,DNA的长度压缩约1000倍(图12-2d)有丝分裂时染色质进一步压缩为染色体,压缩包装比高达10 000(图12-2e)染色质必须转变成松散的核小体,才能进行基因转录 组蛋白富含精氨酸和赖氨酸,在细胞内含量丰富,是高度保守的蛋白质最保守的是H4,它有102个氨基酸,牛与豌豆的H4只有两个氨基酸的差异H3也比较保守,而H1在各物种之间差异较大研究发现,组蛋白修饰与去修饰包括乙酰化/去乙酰化、甲基化/去甲基化等都可以影响染色质的结构和功能 12.2.2.2 组蛋白对基因活性的影响组蛋白对基因活性的影响 早在1984年,Donald Brown等人发现爪蟾卵母细胞5S rRNA基因可以在卵母细胞中转录,而不能在体细胞中转录他们通过实验证实,组蛋白在体外对基因的活性有影响,TFIIIA、TFIIIB、TFIIIC等转录因子与组蛋白竞争结合基因的调控区卵母细胞5S rRNA基因在体细胞中与转录因子结合能力较低,而与组蛋白结合力强,从而形成稳定的核小体结构,抑制基因转录而卵母细胞5S rRNA基因在卵母细胞中与转录因子结合能力强,阻止组蛋白和DNA的交联,不形成核小体结构,则基因有转录活性。
他们进一步实验发现,在无活性的染色质中,含有5种全部的组蛋白,而在有活性的染色质中没有组蛋白H1,说明在爪蟾卵母细胞中组蛋白H1比核心组蛋白(H2A、H2B、H3、H4)抑制转录的作用更强 对于转录因子如何作用于包装在核小体上的DNA调节序列,提出了两种假说:一种是具有ATP酶活性的染色质重塑因子染色质重塑因子(chromatin remodeling factors),它们通过重构核小体的组蛋白核心或改变DNA链在核小体上的位置来增加启动子序列与转录因子的可接触性, 从而激活基因转录另一种是组蛋白乙酰转移酶组蛋白乙酰转移酶 (histone acetyltransferases, HATs) 家族, 通过对核心组蛋白N-端尾部的赖氨酸残基的乙酰化来实现基因转录的调控大量实验证明, 两种假说均在真核生物的转录调节中发挥重要的作用此外,其它形式的化学修饰, 包括组蛋白末端的甲基化、磷酸化和泛素化等,对真核生物基因转录的调节也极为重要 ((1)) 染色质重塑染色质重塑 染色质中与转录相关的结构变化称为染色质重塑染色质重塑(chromatin remodeling),主要指转录因子进入核小体,建立起有活性的启动子结构的过程。
当活化转录的转录因子或称活化蛋白与DNA调节序列结合后,使核小体移位或者去组装暴露出启动子从而允许通用转录因子与启动子的结合,启动基因转录这些活化蛋白大多是ATP依赖的染色质重塑因子,可重新定位核小体, 改变核小体结构, 共价修饰组蛋白 用核酸酶处理的染色质在凝胶电泳时,转录的和不转录的基因都出现了200bp间隔的DNA带,说明转录的和非转录的基因都是有核小体结构的,因此认为转录的起始过程中需要核小体的移位,即RNA酶结合部位的核小体需要暂时移开,等待RNA聚合酶作用后再重新组装这种核小体移位的效应可能与活化蛋白的活动有关 染色质重建实验发现,Sp1和Gal4等转录活化因子可以逆转H1对基因转录的抑制与裸露的DNA相比,纯化的DNA加入核心组蛋白温育后重建的染色质转录能力下降了75%,当再加入组蛋白H1时,转录能力可进一步下降25~100倍如果在加入H1前先加入Sp1和Gal4等活化蛋白,这种组蛋白基因转录抑制效应可被活化因子所阻止另外,果蝇的GAGA序列被发现可以结合热休克蛋白Hsp70启动子中富含CT的位点,瓦解核小体的结构可见,转录因子和组蛋白竞争性地与基因表达的调控区结合。
若调控区结合组蛋白,基因无转录活性,若调控区结合转录因子,则基因有转录活性(图12-3) 关于转录活化因子调节基因表达机制的假说有两种:① 一个转录因子独立地与核小体DNA结合, 然后这个活化因子再结合一个重塑因子, 导致附近核小体结构发生稳定性的变化,又导致其它转录因子的结合,这是一个串联反应的过程 ② 由重塑因子首先独立地与核小体结合,不改变其结构,但使其松动并发生滑动,这将导致转录因子的结合,从而使新形成的无核小体的区域稳定总结起来,转录因子与组蛋白处于动态的竞争之中,首先替换核小体中的部分的或者全部的组蛋白,导致染色质经历结构的改变,即进行染色质的重塑,才能启动基因的转录,这是一个耗能的过程 在转录的过程中,随着转录泡的移动,需要进行连续的染色质重塑,在此过程中,重塑因子复合物的作用非常重要(图12-4)这些复合物都具有ATP酶活性从酵母和果蝇体内发现的重塑因子复合物包括两种SWI/SNF复合物和三种ISWI(imitation SWI)复合物SWI/SNF复合物家族包括BRG1、hBRM 和ISW I相关复合物ISW I 复合物家族包括RSF、HuCHRAC和CAF1。
ISWI 相关复合物只识别核小体, 而SWI/SNF 复合物识别核小体和裸露的DNA,亲和力高, 通过与DNA作用,可移动核小体,产生更易被影响的DNA区域,且SWI/SNF的作用不受组蛋白N端或C端修饰的影响染色质重组过程中,核小体滑动可能是一种重要机制, 它不改变核小体结构, 但改变核小体与DNA 的结合位置 转录因子以及染色质重塑因子与启动子上特定位点结合后, 引起特定核小体位置的改变(滑动) , 或核小体三维结构的改变, 它们都能改变染色质对核酶的敏感性用DNAase I处理染色质,再用特定基因的cDNA作为探针,可以测定某个基因被DNAase I降解的情况研究发现,活性基因优先被降解例如,从小鸡红细胞提取的β-球蛋白基因和卵清蛋白基因分别用DNAase I处理,β-球蛋白基因很快被降解,卵清蛋白基因却很少被降解然而,从小鸡输卵管细胞提取的这两种基因,DNAase I处理后,优先降解的是卵清蛋白基因由此可见,基因活化时染色质的结构发生了变化,对DNAase I敏感性的提高成为衡量活性基因区域内染色质结构变化的一个重要指标 ((2)) 组蛋白的修饰组蛋白的修饰 组蛋白N-末端氨基酸残基可发生乙酰化、甲基化、磷酸化、泛素化、多聚ADP糖基化等多种共价修饰作用。
真核细胞通过多途径的翻译后修饰实现对染色质结构和功能的精确调控,从而调控转录、DNA复制、DNA修复和基因组稳定性组蛋白翻译后修饰所引起的染色质结构重塑在真核生物基因表达调控中发挥着重要的作用通过组蛋白氨基末端残基的翻译后修饰对染色体结构和基因转录进行调控, 是目前表观遗传学表观遗传学(epigenetics)研究领域的重要部分组蛋白的修饰可通过影响组蛋白与DNA双链的亲和性,从而改变染色质的疏松或凝集状态,或通过影响其它转录因子与结构基因启动子的亲和性来发挥基因调控作用单一组蛋白的修饰往往不能独立地发挥作用,一种修饰的存在可以指导或抑制同一组蛋白上另一修饰的存在,形成一个修饰的级联这些修饰可作为一种标志或语言, 也被称为“组蛋白密码组蛋白密码”(histone code),组蛋白密码大大丰富了传统遗传密码的信息含量 早在1964年,Vincent Allfrey就发现组蛋白既有乙酰化形式,也有非乙酰化形式,乙酰化主要发生在赖氨酸的ε-氨基上组蛋白乙酰化可以激活转录,其机理可能是:将乙酰辅酶A的乙酰基转移到Lys的ε-NH3+,消除其正电荷,这样可减弱DNA与组蛋白的相互作用,松散染色质结构,以便转录因子和RNA聚合酶与DNA的结合,促进转录起始复合物的装配,从而激活转录。
研究发现,8聚体的核心蛋白有32个潜在的乙酰化位点,H3和H4乙酰化的程度大于H2A和H2B果蝇活性染色质的H4乙酰化可发生在Lys-5、Lys-16和Lys-78位点,表明组蛋白的乙酰化有位点特异性 染色质特定部位的组蛋白乙酰化状态主要由组组蛋白乙酰化酶蛋白乙酰化酶(histone acetylases, HAT)和组蛋白去组蛋白去乙酰化酶乙酰化酶(histone deacetylases, HDAC)催化完成的HAT通过在组蛋白赖氨酸残基乙酰化,激活基因转录,而HDAC使组蛋白去乙酰化,抑制基因转录Kleff等在温度敏感性酵母突变株细胞提取物中发现至少有两种HAT, 可使H4第1~28个氨基酸残基中的Lys乙酰化转录共激活因子CBP、P300、Gcn5P、TAFII-250和PCAF都被发现实质上是体内的组蛋白乙酰基转移酶真核细胞HAT分为两型:A型主要存在于胞核中,与染色质结合,乙酰化染色质组蛋白B型主要存在于胞浆中,乙酰化游离的组蛋白 当不需要转录某种基因时,组蛋白去乙酰化酶可以催化组蛋白的去乙酰化,降低组蛋白的乙酰化程度,使染色质回复到转录抑制状态。
HDAC最早是在鸡红细胞的核基质中发现的,目前大约有5种去乙酰化酶已被识别组蛋白去乙酰化常伴随基因沉默生化测定发现,在基因抑制的区域有低乙酰化的组蛋白积聚,HDAC抑制剂能够诱导某些基因的转录,说明HDAC确实与基因的抑制有关根据与酵母HDACs的同源性,去乙酰化酶被分为三类:第一类与酵母的Rpd3相似,主要在细胞核内与转录辅助因子结合第二类与酵母的Hda1相似,相对分子质量较大,在胞核与胞浆中相互转运第一与第二类HDACs均对去乙酰化酶抑制剂trichostatin A(TSA)敏感第三类与酵母的Sir2相似,需要NAD+作为辅酶,但对TSA不敏感 组蛋白乙酰化和去乙酰化与基因表达调控密切相关,HAT和HDAC之间的动态平衡控制着染色质的结构和基因的表达组蛋白乙酰化状态的失衡与肿瘤发生密切相关最近有研究发现,肿瘤细胞的组蛋白大部分呈低乙酰化状态,因此基于细胞内组蛋白乙酰化调控机制来设计开发抗肿瘤药物成为研究热点组蛋白去乙酰化酶抑制剂可以增强细胞内组蛋白乙酰化状态,从而改变肿瘤的生物学特性,而且去乙酰化酶抑制剂作用靶点是整个基因组而不是单个基因,所以去乙酰化酶抑制剂在肿瘤治疗中具有较好的应用前景。
组蛋白甲基化是指发生在H3和H4组蛋白N-端赖氨酸或者精氨酸残基上的甲基化,由组蛋白甲基转移酶催化赖氨酸可以分别被一、二、三甲基化, 精氨酸只能被一、二甲基化组蛋白H3的K4、K9、K27、K36、K79和H4的K20均可被甲基化组蛋白甲基化的功能主要体现在异染色质形成、基因印记、X染色体失活和转录调控方面在组蛋白H3上,共有5个赖氨酸位点可以被甲基化修饰Su(var)3-9 蛋白是在果蝇中发现的第一个组蛋白赖氨酸甲基转移赖氨酸甲基转移酶酶,到目前为止,已发现了数十种赖氨酸甲基转移酶和两大类组蛋白精氨酸甲基转移酶精氨酸甲基转移酶(protein arginine methyltransferase,PRMT) 一般来说, 组蛋白H3K4位点的甲基化主要聚集在活跃转录的启动子区域H3K9、H3K27、H3K79、H4K20位点的甲基化发挥转录抑制作用最早被发现的组蛋白赖氨酸甲基转移酶Suv3-9可直接作用于组蛋白H3的Lys9使之甲基化,其催化结构域位于一个高度保守的SET结构域,该结构域名称来源于果蝇参与表型遗传的3个基因Su(var)3-9、E(z)和Trithorax。
H3K9 甲基化后与招募来的HP1蛋白结合,RB蛋白招募Suv39/HP1 复合体,共同控制cyclin E启动子,从而实现转录抑制功能缺失RB蛋白 时,H3K9是不甲基化的,而且HP1和cyclinE启动子也是不相关的 所以认为必须要有RB蛋白才能发挥H3K9 甲基化的转录抑制功能值得注意的是,RB蛋白调控的赖氨酸甲基化都发生在该位点去乙酰化后,现在还不清楚是不是RB 蛋白本身在募集去乙酰化酶和甲基转移酶过程中本身就有顺序性目前从酵母到人,多个物种中已经分离到十几个组蛋白H3赖氨酸甲基转移酶它们的共同特点是除了组蛋白H3-K79甲基转移酶Dot1,其它都含有SET结构域, 可以特异性地修饰组蛋白的不同位点 组蛋白的甲基化曾被认为是不可逆的过程但组蛋白去甲基化酶的发现,使这一观点面临巨大挑战最早发现的是一种可以将甲基化的精氨酸转变为瓜氨酸同时释放甲胺的蛋白PAD4(peptidylarginine deiminase 4),PAD4可以作用于H3、H4的多个精氨酸位点随后,又发现一种具有去甲基化和转录阻遏功能的蛋白LSD1(Lysine specific demethylase 1)。
在FAD的参与下, LSD1在体外可以特异性去掉H3K4的二甲基和一甲基修饰,在体内则可以去掉H3K9的二甲基和一甲基修饰最新的研究发现,JHDM1 (JmjC domain-containing 去甲基酶1)在二价铁离子和酮戊二酸盐的存在下, 特异地使甲基化的H3-K36去甲基化,并产生甲醛和琥珀酸盐在生物体内,JHDM1的过表达可以降低二甲基化的H3-K36的水平,并可以去掉赖氨酸的三甲基化修饰在S. cerevisiae中,JHDM1的同源物同样具有去甲基化酶的活性从某种角度上来讲,PAD4将甲基化的精氨酸转变为瓜氨酸,改变了一个氨基酸残基,并不是严格意义上的去甲基化反应,而JHDM1则可以认为是一种去甲基化酶首先,两者的反应机制不同其次,LSD1蛋白家族中只有一少部分蛋白与去甲基化相关,而JHDM1 拥有一个巨大的家族,具有潜在的能力来调节和抑制不同的组蛋白甲基化最后,LSD1的去甲基化反应需要质子化的氮,因而限制了它对三甲基化的组蛋白去甲基化的能力 12.2.3 非组蛋白对基因活性的影响非组蛋白对基因活性的影响 真核生物染色体DNA除了与组蛋白结合,还与大量的非组蛋白结合。
非组蛋白非组蛋白是指细胞核染色体中除组蛋白以外的所有蛋白质,包括高迁移率族高迁移率族HMG蛋白蛋白,以DNA作为底物的酶,如RNA聚合酶,以及作用于组蛋白的一些酶,如组蛋白甲基化酶,具有相对分子质量小、富含带电荷氨基酸的特点大量的实验证实,非组蛋白在间期细胞核中与DNA相连能解除组蛋白对DNA转录的抑制,促进DNA转录,而且非组蛋白还能决定转录出的mRNA的性质这表明非组蛋白是重要的基因调控成分 小鼠染色质重建实验可以很好的说明非组蛋白对转录起着重要的作用(图12-6) 非组蛋白调节基因表达的机制可能与它的磷酸化有关非组蛋白结合在DNA的某一特定位置上,非组蛋白磷酸化以后,磷酸基带负电荷,与带负电荷的DNA相斥,并与带正电荷的组蛋白结合结合的组蛋白与非组蛋白复合体从DNA上脱离,于是解除组蛋白对DNA的抑制作用,DNA裸露出来并开始转录如果非组蛋白去磷酸化,即与组蛋白分开,组蛋白重新结合DNA,使活化的DNA抑制,转录停止细胞内的cAMP通过激活蛋白激酶使非组蛋白磷酸化,磷酸化后的非组蛋白与组蛋白结合,解除其对DNA的抑制作用 目前研究的比较清楚的非组蛋白当属HMG蛋白,这类蛋白质相对分子质量比较小,在聚丙烯酰胺凝胶电泳中迁移速率很高,因此把它们称为高迁移率蛋白或HMG蛋白。
HMG蛋白共有三个家族:HMG1/2、HMG14/17、HMGI(y)研究发现,HMGI(y)可以结合到DNA小沟中富含AT的结构,借助其羧基端酸性氨基酸的结构域和转录因子相互作用,参与病毒诱导的人干扰素β基因的表达调控 另外,HMG蛋白还和染色质DNA对DNaseI敏感性有关用DNA酶I处理鸡红细胞染色质时,优先释放出HMG14和HMG17两种非组蛋白缺乏HMG14和HMG17时,染色质中正在转录着的基因组序列便失去了对DNA酶I的优先敏感性一旦把HMG14和HMG17重组到缺乏HMG的染色质中之后,这种敏感性就可以恢复通过这种染色质重建研究,和固相化HMG14和HMG17的亲和层析分析,可知HMG14和HMG17选择性地与转录活跃序列的核小体相结合,一分子的 HMG使大约10~20个核小体染色质具有对 DNA酶I的优先敏感新近的研究发现在爪蟾卵提取物中HMG17掺入到DNA复制后新组装的染色质中会促进RNA聚合酶III的基因转录而HMG14则可直接参与 RNA聚合酶II对染色质中基因的转录说明HMG与DNA的结合会使染色质结构松散,使得染色质对DNaseI敏感可能的机制是,HMG蛋白羧基端的酸性氨基酸结合核心组蛋白的碱性氨基酸,竞争性的取代核小体上的H1,使染色质结构变得松散,从而导致了染色质的活化。
12.2.4 核基质对基因活性的影响核基质对基因活性的影响 核基质核基质(nuclear matrix) 亦称核骨架,是指真核细胞核内除去核膜、核纤层、染色质、核仁以外的一个由纤维蛋白构成的网架体系呈网络状的核基质纤维充满核空间,与核纤层和核孔复合体相连,核仁被网络在核基质纤维的网架中核基质、核纤层和中等纤维形成一个贯穿于核质间的统一网架结构体系核基质纤维的直径为3~30nm,主要成分是纤维蛋白,其中相当部分是含硫蛋白,并含有少量RNA,是以蛋白质为主并含有少量RNA的复合物核基质具有广泛生物学效应,它可能参与染色体DNA有序包装和构建,对于间期核内DNA有规律的空间构型起着维系和支架作用,可能是DNA复制的基本位点,与基因表达密切有关,可能是细胞核中RNA转录位点和hnRNA的加工场所 核基质的作用方式主要是提供结合位点,核基质结合区核基质结合区(matrix attachment region,MAR)是一段在体外能与核基质结合的富含AT的DNA序列研究发现,MAR能使染色质形成环状结构将MAR构建到目的基因两侧并以此载体转化至生物体中,发现它能增强基因转录表达水平及稳定性,在一定程度上降低转基因个体或细胞系之间转基因的表达水平的差异,这很可能是降低了基因沉默所致。
另外,核基质还可以使染色体开放当HMGI(y)大量存在时,MAR可以和染色质中的HMG相互作用而取代组蛋白H1,促使染色质处于松散状态,这样RNA聚合酶就容易接近染色质,从而提高基因表达水平 核基质的功能不仅仅依靠核基质本身的蛋白质完成,更重要的是要通过多种核基质结合蛋白的共同参与,完成核基质复杂多样的生物学功能长期以来人们对此进行了大量的研究,并证实细胞信号识别和细胞周期的调控因子以及病毒特异的调控蛋白等能够紧密结合在核骨架结构上 12.2.5 基因的丢失基因的丢失 研究发现,有的生物在个体发育过程中,体细胞中RNA合成的DNA模板也会发生规律性的变化,如基因本身或其拷贝数发生了永久性的改变,来控制基因表达和生物体的发育基因丢失基因丢失(gene loss)是指真核生物随着细胞的分化丢失染色体中部分DNA片段的现象随着染色体上部分DNA片段的丢失,最终造成基因的丢失然而,在生殖细胞中保持着全部的基因组,被丢失的染色体上的遗传信息对体细胞来说可能没有意义,但对生殖细胞或许是不可缺少的 马蛔虫受精卵染色体的丢失是一个很好的例子马蛔虫受精卵细胞内只有一对染色体,但染色体上有多个着丝粒。
在发育的早期,只有一个着丝粒起作用,使有丝分裂顺利进行但到发育后期,在纵裂的细胞中染色体分成很多的小片段,有的含有着丝粒,有的不含着丝粒,其中不含着丝粒的染色体片段丢失然而,横裂的细胞中染色体并不丢失第一次有丝分裂是横裂,产生上下两个子细胞上面的子细胞在第二次卵裂时发生纵裂,丢失部分染色体,而下面的子细胞仍然发生横裂,最终发育成生殖细胞 最近研究发现,基因丢失可能还参与肿瘤的发生实验证实,某些肿瘤细胞中含Rb和p53等抑癌基因的染色体位点上有特异性的基因缺失,造成它们功能的部分或者全部丧失,导致肿瘤的发生 12.2.6 基因的扩增基因的扩增 基因扩增基因扩增(gene amplification)指基因组中某些基因的拷贝数大量增加,使细胞在短期内产生大量的基因产物来满足生长发育需要的现象例如,爪蟾的卵母细胞利用基因扩增方式,转录生成大量的rRNA,为胚胎发育准备大量的合成场所,满足胚胎快速发展的需要爪蟾卵母细胞染色体上有约450拷贝的18S、5.8S和28S的rRNA基因,它们是环状的DNA,以滚环的方式进行复制扩增,复制两次可使基因的拷贝数扩大1000倍以上。
通过这种方式,非洲爪蟾卵母细胞中rDNA的拷贝数可由平时的500份急剧增加到200万份,以适应胚胎发育对核糖体的需求 基因扩增也可经诱导产生氨甲喋呤是二氢叶酸还原酶(DHFR)的竞争性抑制剂,可阻断叶酸的代谢研究发现,用氨甲喋呤处理培养的细胞,可以筛选出耐氨甲喋呤的细胞,对这种细胞的DNA进行分析,检测到二氢叶酸还原酶基因发生了突变,因此才对氨甲喋呤产生了抗性在经过几轮筛选后,这个抗性基因可扩增上千倍这些抗性基因扩增的细胞中,含有许多染色体外的成分,称作微小染色体,它们可能是通过DHFR拷贝之间或者等位基因之间的非同源重组而产生的 另外,在癌细胞中也经常可以检查出癌基因的扩增例如,在胃癌、肠癌和白血病患者中,原癌基因c-myc都增加了数十倍 12.3 染色体基因的重排染色体基因的重排 染色体重排染色体重排(chromosomal rearrangement)是指染色体发生断裂与别的染色体相连,或者通过基因的转座、DNA的断裂错接而使正常基因顺序发生改变染色体重排可以产生新的基因,表达新的基因产物染色体基因重排是原核和真核生物中广泛存在的基因表达调控机制。
12.3.1 免疫球蛋白基因的重排免疫球蛋白基因的重排 免疫球蛋白免疫球蛋白(Immunoglobulin, Ig)是有抗体活性的糖蛋白,主要存在于血浆,也见于其它体液、组织和一些分泌液中人血浆内的免疫球蛋白大多数为γ-球蛋白,可分为IgG、IgA、IgM、IgD和IgE五类其中IgG是最主要的免疫球蛋白,约占人血浆丙种球蛋白的70%,Mr约15万,含糖2~3%,由2条肽链Mr为2.5万的轻链, 和2条Mr为5万的重链组成,轻链与重链之间通过二硫键相连接(图12-7a)免疫球蛋白是机体受抗原(如病原体)刺激后产生的,其主要作用是生成抗原-抗体复合物,使病原体失去致病作用(图12-7b) 自然界的抗原种类极多,每种抗原有不同的抗原决定簇,因此具有多种特异性的免疫球蛋白分子必定有极多的种类,估计一个哺乳动物体内可产生106~108种不同的抗体可是,脊椎动物基因组内所有的基因总共不过几万个左右因此,决不可能有那么多的免疫球蛋白基因去编码每一种特定的免疫球蛋白分子研究证明,免疫球蛋白的多样性是通过基因重排形成的 免疫球蛋白的两条重链和两条轻链分别是由三个独立的基因簇所编码,其中两个编码轻链κ和λ,一个编码重链,他们分别位于6、16和12号染色体上。
决定轻链的基因组上分别有L、V、J和C四类基因片段,决定重链的基因组上共有L、V、D、J和C五种基因片段L代表前导片段前导片段(leader segment),V代表可变片段可变片段(variable segment),J代表连连接片段接片段(joining segment),C代表恒定片段恒定片段(constant segment),D代表多样性片段多样性片段(diversity segment) 在胚胎细胞中,V、J、(D)和C基因是分散排列的,相隔较远在B细胞发育成熟过程中,组成免疫球蛋白分子的各个基因片段进行体细胞重组体细胞重组(somatic recombination),V区发生D-J或V-D-J重排,与C基因连接,转录产生mRNA随机重排的结果可以产生108~1010种免疫球蛋白分子12.3.1.1 重链的重排重链的重排 在B淋巴细胞发育分化时,形成有功能的重链基因需要经过两次在DNA水平的重排(图12-8)第一次是D基因片段移位到J基因片段处,删除二者之间的序列,形成D-J连接第二次是V与D-J的重排形成V-D-J连接从数百个V基因中随机选择一个,形成有转录功能的V-D-J复合物,这是Ig基因表达的一个关键控制点。
这样,就形成一个完整的转录单位,转录形成的mRNA前体还需要切除V-D-J与C之间的内含子,才能成为成熟的mRNA分子,指导免疫球蛋白的翻译合成目前所知,一个重链区可以通过300个V基因,20个D基因,和4个J片段的重组而产生数千种肽链 12.3.1.2 轻链的重排轻链的重排 轻链重排的机制与重链基本相同,但L链只进行一次DNA水平的重排首先V与J基因片段连接形成V-J,然后V-J与C基因相连形成L链的mRNA两个编码轻链的基因簇κ和λ哪一个发生重排是随机的,但一个发生重排,另一个的重排就会受到抑制,这就是轻链的类型排斥在淋巴B细胞发育中,只有κ链重排失败,才会发生λ的重排轻链基因可以通过300个V基因和4个J片段重组而产生数百种肽链 免疫球蛋白基因的重组发生在高度保守的回文结构的七聚体碱基序列,其间由12或23个碱基对将其与一个富含A/T的九聚体碱基序列相隔重组以双链断裂(double-strand breaks)机制,经重组激活基因编码的RAG1/2蛋白识别、催化、切除与连接来完成(见图6-15) 重链和轻链通过基因重排,产生在DNA水平上的多样性。
轻链和重链之间的随机组合,又增加了免疫球蛋白的多样性,这就是免疫球蛋白多样性产生的机制 12.3.2 酵母交配型染色体的重排酵母交配型染色体的重排 酿酒酵母细胞有两个不同交配型交配型(mating type)的单倍单倍体体(haploid),可结合而形成二倍体二倍体(diploid)二倍体细胞(酵母的优势形态)通过简单的有丝分裂繁殖,但在外界条件不佳时进入减数分裂,生成一系列单倍体孢子以上两种生活形态由菌体的交配型a和α决定,这两种交配型是一种原始的性别分化,由位于第三染色体上的MAT(mating type locus)基因所控制带有MATa等位基因的细胞叫做a细胞,带有MATα等位基因的细胞叫做α细胞如果两个单倍体相同,则不能接合成二倍体 研究发现,细胞分泌的信息素信息素(pheromones)可以识别相反交配型的细胞a细胞分泌的a因子,是12个氨基酸构成的短肽α细胞分泌的α因子,是13个氨基酸构成的短肽这两个短肽经剪接、修饰加工后分泌到细胞外发挥识别功能巧妙的是,每一种细胞携带有另一类型细胞外信息素的受体,所以才导致不同类型细胞的相互识别 随后发现,a和α细胞可以发生交配型转变,交配型转变与MAT座位两侧的HML和HMR位点有关 。
目前流行的盒式模型盒式模型(cassette model)认为, MAT位置上有a型或α型活性盒(active cassette),而 HML有α型沉默盒(silent cassette),HMR有a型沉默盒如果HML转移到MATa上,MAT从HML接受α盒,细胞便从a型转变成α型如果HMR转移到MATα位置上,MAT从HMR接受α盒,细胞便从α型转变成a型 (图12-9)这实际上也是一个转座的过程,MAT作为转座的受体,接受供体HMLα和HMRa的遗传信息,发生基因重排,导致了交配型的转变 12.4 DNA水平的调控水平的调控12.4.1 DNA的甲基化的甲基化 DNA甲基化是最早发现的一种真核生物基因表达调控的重要方式,通常是指胞嘧啶5-位碳原子的甲基化(m5C) , 是一种DNA 复制后的酶促反应过程DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达 高等真核生物细胞的DNA有2% ~ 7%的胞嘧啶是被甲基化修饰的,主要集中在基因5‘ -端的非编码区,并成簇存在DNA甲基化主要形成m5C,少量的N6-甲基嘌呤(N6-mA)及7-甲基鸟嘌呤(m7G)。
在甲基转移酶的催化下,DNA的CG两个核苷酸的胞嘧啶被选择性地修饰为m5C 如果只有一条DNA链的C发生甲基化,称半甲基化半甲基化如果两条链的C都发生甲基化,则称完全甲基化完全甲基化,且两个甲基基团在DNA双链大沟中呈特定三维结构发生甲基化的DNA序列主要集中在CpG岛上(CpG = 5'- CG -3' ),CpG 岛存在于所有管家基因和少量组织特异性基因的5' 端调控区人类DNA 中约3%的胞嘧啶核苷酸被甲基化,其中大部分存在于CpG 岛中人类基因组中约有45000个CpG岛,而小鼠基因组中只约有15500个CpG岛所有持续表达的管家基因均含有CpG岛,占基因组中CpG岛总数的一半甲基化位点可随DNA的复制而遗传,因为DNA复制后,甲基化酶可将新合成的未甲基化的位点进行甲基化 DNA甲基化甲基化可使染色质高度螺旋化,凝缩成团,失去转录活性使DNA 失去限制性内切酶的切割位点,以及DNAaseI的敏感位点,因此,可以用特定的限制性内切酶鉴定甲基基团的存在如限制酶HpaII识别并切割甲基化的CCGG序列,但对甲基化的CG则不起作用,而MspI 能切割所有的CCGG序列DNA甲基化是一个动态的过程,甲基化转移酶可以将DNA甲基化。
DNA 甲基转移酶有两种:① 持续性DNA甲基转移酶(mantainance DNA methyltransferase,DNMT1),作用于半甲基化的DNA, 使其完全甲基化,可参与DNA复制双链中新合成链的甲基化,DNMT1能直接与HDAC (组蛋白去乙酰基转移酶) 联合作用阻断转录② 从头甲基转移酶 (de novo methylase, DNM T3a,DNM T3b),可甲基化CpG,使其半甲基化,继而全甲基化从头甲基转移酶可能参与细胞生长分化调控,其中DNM T3b在肿瘤基因甲基化中起重要作用 DNA 去甲基化有两种方式:① 被动途径,由于核因子N F 粘附甲基化的DNA,使粘附点附近的DNA不能被完全甲基化,从而阻断DNM T1的作用② 主动途径,是由去甲基酶的作用,将甲基集团移去的过程虽然相关DNA去甲基酶的研究已经开展了多年,但目前尚无定论 12.4.2 DNA甲基化对转录活性的影响甲基化对转录活性的影响12.4.2.1 DNA的甲基化可引起基因的失活的甲基化可引起基因的失活 在一些不表达的基因中,启动区的甲基化程度很高,而处于活化状态的基因则甲基化程度较低。
例如,卵黄蛋白是在成熟的雌性动物肝中先合成卵黄蛋白原卵黄蛋白原(vetellogenin),然后分泌到血液中,再运送到卵巢,加工成卵黄蛋白雄性动物也有卵黄蛋白原基因,但不能表达,这是因为缺乏雌激素之故,其分子机制与甲基化有关鸡的卵黄蛋白原基因的5'-调节区有4个CpG位点,C,D位点是雌二酮受体蛋白复合物的结合部位在雌激素处理后,在-612(C)的HpaII位点处于低甲基化状态正常肝细胞DNA的正链上4个位点全部甲基化,而互补的负链只有50%甲基化,但经雌二酮处理后数小时内甲基化的形式发生急剧变化,正链中4个位点全部去甲基化,与卵黄蛋白原mRNA相吻合,而负链上4个位点滞后24小时才甲基化因此,卵黄蛋白原基因在雄体中处于高度甲基化状态,没有活性 甲基化酶对CpG位点的化学修饰是有选择的,如小鼠β-珠蛋白基因5' -侧翼有5个CpG位点,用纯化的DNA甲基转移酶在体外处理这段序列,有的位点不发生甲基化,有的稍有甲基化,有的大量甲基化采用诱导的或未诱导的细胞,纯化酶或粗制酶都一样,表明还有其它的选择因素存在 DNA 甲基化阻遏基因的表达,主要有三种机制。
一是甲基化DNA上的转录因子结合位点,使得这些转录因子(如E2F、CREB、A P2、N F2KB、Cmyb、Ets等)不能与DNA结合二是通过DNA甲基化使转录抑制因子转录抑制因子(Transcriptional repressor)结合到DNA上三是通过甲基化CpG 粘附蛋白(MeCP2、MBD2)作用于甲基化非敏感转录因子(SP1、CTF、YY1) ,使它们失活,从而阻断转录已发现至少5 种带有恒定的甲基化DNA 结合域(Methyl-CpG-binding domain, MBD) 的甲基化CpG 粘附蛋白例如,MeCP-1和MeCP-2是位于启动子CpG岛上的两种甲基化结合蛋白,任何一种结合于启动子上都能阻止通用转录因子和RNA聚合酶起始复合物的装配,从而抑制基因转录 12.4.2.2 基因印记基因印记 来自双亲的同源染色体或等位基因在功能上存在差异,同一种染色体或基因的改变,由不同的亲本传给子代时可引起不同的表型,这种依赖于亲本起源的特殊等位基因上产生修饰、并引起等位基因表达不对称的现象称基因组印记基因组印记(genomic imprinting) 或遗传印记遗传印记(genetic imprinting), 其中父(母) 源等位基因不表达者,称为父(母) 源印记,产生印记效应的基因称为印记基因( imprinting genes)。
基因组印记是在基因组DNA水平上对双亲等位基因特异性的修饰作用,发生在胚胎发育早期,即一个亲本的特定等位基因或其所在染色体在配子或受精卵中发生遗传学修饰,引起2个等位基因的不同表达 DNA甲基化是基因组印记发生和维持的主要机制,主要有2 种形式:① 一些印记基因如H19、Igf2r、SNRPN、XIST 等基因在启动子区CpG 岛上有等位基因差异的甲基化,并与表达负相关② 另一些基因如Igf2 在非启动子区甲基化,并与其表达呈正相关哺乳动物的基因组中有100 多个印记基因,约占基因总数的0.1%,在胚胎和成体的二倍体体细胞中,源于父本或母本的等位基因有选择性表达的特征如H19 基因表达来自母亲的染色体,而Igf2 则表达来自父亲的染色体,造成这个现象的原因正是基因印记 12.5 真核生物转录水平的调控真核生物转录水平的调控 真核生物的结构比原核生物复杂,所以真核生物的基因表达除了需要活化染色质,还需要活化基因,即转录水平的调节,而且转录水平的调控是真核生物基因表达调控中最关键的调控阶段在转录水平的调节中,顺式作用元件和反式作用因子相互作用,共同控制着基因转录的起始和频率。
12.5.1 顺式作用元件的结构顺式作用元件的结构 顺式作用元件顺式作用元件是真核生物细胞同一DNA分子中具有转录调节功能的特异DNA序列,主要指上游的调控区域内能与转录因子结合并影响基因转录的起始和频率的特异性DNA调控序列按功能特性,真核基因顺式作用元件分为启动子、增强子及沉默子起正调控的顺式作用元件主要包括启动子和增强子,起负调控作用的顺式作用元件主要指沉默子 12.5.1.1 启动子启动子 RNA聚合酶II的启动子由近端的核心启动子和上游启动子元件元件构成,核心启动子包括转录的起始位点起始位点(initiator,Inr)和上游-30~-25bp处的TATA盒起始位点的共有序列是Py2CAPy5,即mRNA的第一个碱基通常为A,左右有数个嘧啶TATA盒的核心共有序列是TATAA,控制转录起始的准确性及频率TATA盒是基本转录因子TFIID的结合位点,TATA盒内单个碱基缺失或者突变,转录水平会大大下降由TATA盒及转录起始点即可构成最简单的启动子,此外,位于转录起始点上游-110~-30 bp区域的GC盒(GGGCGG)和CAAT盒(GCCAAT)也是很多基因常见的上游启动子元件(upstream promoter element,UPE)。
CAAT盒是转录因子CTF/NF1的结合位点,对转录的效率十分重要GC盒是转录因子Sp1等的结合位点,主要控制转录起始的频率, CAAT盒和GC盒并非所有的真核生物都有,二者都不参与起始位点的确定有些TATA缺失的基因不含UPE,但常有位于+28~+32的下游启动子元件下游启动子元件(图12-10) 总结起来,Inr和TATA盒主要决定转录的起始位点和方向,引起低水平的转录,而UPE能影响转录起始的频率,它通过和各种调控因子相结合,促进转录起始复合物的组装,提高转录起始的频率 12.5.1.2 增强子增强子 增强子增强子(enhancer)指远离转录起始点(1~30 kb),增加同它连锁的基因转录频率的DNA序列有效的增强子可以位于基因的5'-端,也可位于基因的3'-端,有的还可位于基因的内含子中增强子一般能使基因转录频率增加10~200倍,有的甚至可以高达上千倍例如,人珠蛋白基因的表达水平在巨细胞病毒巨细胞病毒(cytomegalovirus,CMV)增强子作用下可提高600~1 000倍增强子也是由若干机能组件组成,有些机能组件既可在增强子、也可在启动子中出现。
这些机能组件是特异转录因子结合DNA的核心序列从机能上讲,没有增强子存在,启动子通常不能表现活性没有启动子时,增强子也无法发挥作用有时,对结构密切联系而无法区分的启动子、增强子样结构统称启动子增强子发挥作用的方式通常与方向、距离无关,甚至远离靶基因达几千kb也仍有作用(图 12-11) 1981年Benerji在SV40DNA中发现一个140bp的序列,能大大提高SV40和兔β-血红蛋白融合基因的表达水平 这是第一个被发现的增强子,位于转录起始点上游约200bp处,由两个72 bp的正向重复序列组成目前发现的增强子多半是重复序列,一般长50bp,通常有8~12bp的“核心”序列,如SV40增强子的核心序列是5'-GGTGTGGAAAG-3' 增强子的功能是可以累加的缺失实验显示,SV40增强子序列可以被分为两半,缺失一个并不产生什么影响,但如果两个均缺失即将大大降低活体内的转录每一半序列本身作为增强子功能很弱,但合在一起,即使其中间插入一些别的序列,仍然是一个有效的增强子因此,要使一个增强子失活必须在多个位点上造成突变对SV40增强子而言,没有任何单个的突变可以使其活力降低10倍。
有人发现,如果将β珠蛋白基因放在含有72bp重复的DNA分子中,它的转录作用在活体内将增高约200倍以上,甚至当此72bp顺序位于离转录起点上游1400bp或下游3000bp时仍有作用 增强子有两点有别于启动子:一是增强子对于启动子的位置不固定,二是它能在两个方向产生作用一个增强子并不限于促进某一特殊启动子的转录,它能刺激在它附近的任一启动子增强子是如何能在如此远的距离之外还能够增强基因的表达?一种观点认为,增强子为转录因子进入启动子区的位点提供了帮助,提高了启动子附件转录因子的聚集度第二种认为,增强子能改变染色质的构象,因为增强子区域容易发生从B-DNA到A-DNA的构象变化 许多增强子的增强效应有很高的组织细胞专一性(tissue specificity),,只有在特定的转录因子(蛋白质)参与下,才能发挥其功能例如免疫球蛋白基因的增强子只有在B淋巴胞内,活性才最高,在胰岛素基因和胰凝乳蛋白酶基因的增强子中都发现了有很强的组织特异性此外,所有的增强子中均有一段由交替的嘧啶-嘌呤残基组成的DNA,这种DNA极易形成Z-DNA型故有人认为在形成一小段Z-DNA后,增强子才有功能。
许多增强子还受外部信号的调控,这种增强子的活性通常要有特定的启动子参与例如,小鼠乳腺肿瘤病毒(MMTV)DNA的转录可受糖类固醇激素的刺激这个能受激素影响的顺序位于转录起点上游约100bp处此顺序可能和激素及其蛋白受体组成的复合物相结合当将此顺序放在某基因的启动子的任一方向(即上游或下游)和各种不同的距离时,它仍能刺激该基因的转录所以增强子还反映了瞬时瞬时调控调控(temperal regulation)的特性,其激活作用可能是:糖类固醇激素进入细胞后即与其受体结合,被激活的受体能识别存在于增强子中的共同顺序,进而激活了在增强子附近能对糖类固醇起反应的基因,使其启动子起始转录 12.5.1.3 沉默子沉默子 沉默子沉默子(silencers)指某些基因含有的一种负性调节元件,当其结合特异蛋白因子时,对基因转录起阻遏作用沉默子的DNA序列可被调控蛋白识别并结合,这样就阻断了转录起始复合物的形成和活化,关闭基因表达沉默子最初是在酵母细胞中发现的酵母细胞的MAT基因和HMR、HML基因的启动子都存在于具有相同序列的Y区,但MAT基因可以转录,而HMR、HML基因却不能转录。
缺失分析发现在HMR、HML基因上游-1kb的位置存在沉默子,因此阻止这两个基因的转录 12.5.1.4 基因座控制区基因座控制区 基因座控制区基因座控制区(locus control region, LCR)是DNA上的一种顺式作用元件,含有多种反式作用因子的结合序列,可能参与蛋白质因子的协同作用,使启动子处于无组蛋白状态,增强相关基因的表达如人类β-球蛋白在转基因小鼠中的表达还需要ε基因20 kb上游的一组顺式作用元件,这些元件对DNase I 具有高度敏感性,可以调控不同染色体上的基因群表达,其原理尚不十分明了12.5.1.5 绝缘子绝缘子 绝缘子绝缘子(insulator)能阻止正调控或者负调控信号在染色体上的传递,阻断包括增强子、沉默子和LCR的作用,使染色质活性限制在一定结构域之内,它是一种中性的转录调节顺式元件如果绝缘子位于增强子和启动子之间,它会阻断增强子对邻近非相关基因启动子的激活,防止增强子毫无选择的作用于任何启动子相反,如果绝缘子位于活性基因和抑制因子之间,可以保护活性基因受抑制因子的作用而失活绝缘子还可以阻断异染色质的扩散。
12.5.2 反式作用因子的结构和功能反式作用因子的结构和功能 大多数真核转录调节因子由某一基因表达后,可与另一基因上特异的顺式作用元件相互作用,从而激活或抑制另一基因的转录,这种调节蛋白称反式作用因子反式作用因子(图12-12)反式作用因子的重要特点是编码反式作用因子的基因与被反式作用因子调控的靶序列(基因)不在同一染色体上反式作用因子可被诱导合成, 其活性也受多种因素的调节反式作用因子在细胞中的数量很低,大约每个哺乳类细胞中104左右这些蛋白质识别特定的8~15个核苷酸序列,与DNA结合后,可以促进(正调控)或抑制(负调控)其邻近基因的转录 反式作用因子具有三个基本特征:① 一般具有三个功能结构域:DNA结合域、转录/抑制活性域和结合其它蛋白的结合域,它们是其发挥转录调控功能的必需结构这些功能区含有几十到几百个氨基酸残基② 能识别并结合基因调控区中的顺式作用元件③ 对基因表达有正性和负性调控作用,即激活和阻遏基因的表达 根据靶位点的特点反式作用因子可以分为4类: (1) 通用转录因子通用转录因子是RNA聚合酶II结合启动子时所必需的一组转录因子,所有的mRNA转录起始时通用。
通用转录因子主要识别一些RNA聚合酶II启动子的核心成分,如TBP 识别TATA框,CTF/NF-1 识别CAAT框,如SP1识别 GC框,Oct-1识别八聚体核苷酸等 (2)有的结合在增强子区或者上游激活元件上游激活元件(upstream activation sequences, USAs),如甾类-受体复合物有的结合在沉默子并抑制特异转录,与增强子的主要区别是其位于TATA盒下游时就没有功能 (3)辅助激活因子辅助激活因子(coactivators)不与DNA结合,但是对于招募转录因子和转录起始复合物的组装是必不可少的大多数转录因子并不与直接结合在核心启动子的通用转录因子相互作用,而是通过中间体辅助激活因子影响核心启动子的活性辅助抑制因子辅助抑制因子(corepressors)介导抑制性反式作用因子的负性调控活性 (4)与应答元件应答元件(response elements)相结合的反式作用因子应答元件是具有类似特点的一组基因共受一个转录因子调控的启动子或增强子元件,是启动子或增强子的上游元件,它们含有短的保守顺序应答元件在不同的基因中拷贝数比较接近,但不一定相同,离起始点的距离不固定,一般位于上游200bp之内,有的也可以位于启动子或增强子中。
应答元件主要有热休克应答元件(Heat shock response element, HSE),糖皮质激素应答元件(Glucocorticoid response element, GRE),金属应答元件(metal response element, MRE),肿瘤诱导剂应答元件(tumorgenic agent response element, TRE),血清应答元件(serum response element, SRE)等 X-衍射晶体学和NMR光谱学研究发现,真核生物的转录因子至少有两种功能结构域:DNA结合结构域可以结合特异的DNA序列,而激活结构域通过与其它的蛋白质相互作用激活转录此外,有的转录因子相互结合成同源二聚体或者异源二聚体发挥转录调控作用 12.5.2.1 DNA结合结构域结合结构域 转录因子通过氨基酸残基和DNA间的氢键、离子键和疏水作用等与DNA结合,例如,天冬氨酸可以与腺苷酸结合,而精氨酸(Arg)和组氨酸(His)能与鸟苷酸结合每一个DNA结合结构域(DNA binding domain)有一个与DNA序列相互作用的基序基序(motif),多数基序含有一个插入DNA大沟的片段,能识别大沟的碱基序列。
在真核生物细胞中,最常见的DNA结合基序包括螺旋-转角-螺旋、锌指结构、亮氨酸拉链、螺旋-环-螺旋和HMG盒 在很多细菌的调节蛋白中有这种结构基序,如λ噬菌体的cI蛋白,Cro蛋白,在酵母中涉及交配型的a1和a2蛋白也是以这种形式与DNA结合的在高等真核中的Oct-1和Oct-2也属于此类型的DNA结合功能域 (1) 螺旋-转角-螺旋 螺螺旋旋-转角转角-螺旋螺旋(helix-turn-helix)是最先在原核生物中发现的一种DNA结合结构基序其特点是长约20个氨基酸,分为两段,分别为两个α-螺旋两段螺旋之间由10个氨基酸的β转角相连(图12-13a)一个α-螺旋为识别螺旋区,常常带有数个直接与DNA序列相识别的氨基酸,另一个螺旋没有碱基特异性,与DNA磷酸戊糖链骨架接触在与DNA特异结合时,以二聚体形式发挥作用,结合靠蛋白质的氨基酸侧链与特异碱基对之间形成氢键,结合位置是DNA的大沟(图12-13b) (2)锌指结构 锌指锌指(zinc finger)由大约23个氨基酸的环和与环上的4个半胱氨酸(Cys)或2个Cys和2个His配位的锌构成,像一根根手指伸向DNA的大沟(图12-14a)。
两个半胱氨酸位于锌指一侧的反向平行的β-折叠中,而两个组氨酸位于锌指另一侧的α螺旋中第一个发现的锌指蛋白是转录因子TFIIIA,含有9个锌指组成串联重复9个锌指共结合45个碱基,与5S RNA基因的启动子长度接近在转录因子SpI中只有3个锌指(图 12-14b),每个锌指的C末端都形成α-螺旋与DNA结合,三个α-螺旋恰好适合大沟位置 典型的锌指蛋白只有一组锌指,单个的锌指的保守序列是:Cys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X2-His根据锌结合位点的氨基酸类型又把锌指基序分成为2Cys/2His和2Cys/2Cys两类,前者为I型,后者为II型锌指I型结构的“指”由23个氨基酸组成,“指”与“指”之间通常由7~8个氨基酸连接,比如TFIIIA和Sp1在II型锌指中每个指在Cys四分体的中央带有一个锌原子Zn2+结合的保守序列是Cys-X2-Cys-X13-Cys-X2-Cys酵母的转录因子GAL4和哺乳动物的固醇类激素受体是典型的代表糖皮质激素和雌激素受体都有两个“指”,两个指形成α-螺旋,第一锌指含识别螺旋,第二锌指提供二聚化的表面,彼此折叠成一个大的球状功能域。
α-螺旋的芳香族氨基酸和与α-螺旋相连的β折叠一道形成一个疏水中心两个糖皮质激素受体形成二聚体与DNA结合,每个受体负责和连续的大沟接触由于这一特性,固醇类激素受体的结合位点常常较短并具有高度保守的回文结构 (3) 亮氨酸拉链 亮氨酸拉链亮氨酸拉链(leucine zipper)是一种富含亮氨酸的蛋白链形成的二聚体基序,包含30~40个氨基酸的亲脂性的α螺旋,每隔7个残基出现一个亮氨酸由于α螺旋每3.5个氨基酸旋转一周,所有的亮氨酸残基朝一个方向(图 12-15a)与其它疏水基团构成疏水侧,另一侧表面带有电荷两个α螺旋的亮氨酸相互靠近,通过疏水界面形成二聚体(图12-15b) 亮氨酸拉链的侧翼是DNA结合功能区,含有很多的赖氨酸和精氨酸由于赖氨酸和精氨酸是碱性氨基酸,所以它们组成了DNA结合区,可以识别特异的DNA序列二聚体的形成对于DNA的结合是必要的例如,AP1蛋白由c-jun 和c-fos两个亚基组成,它们都属于亮氨酸拉链蛋白,相互作用,形成异二聚体,在细胞增殖方面发挥重要作用两个基因中的任一个突变,都不能形成二聚体,也不能结合DNA和促进转录。
C/EBP具有4个亮氨酸拉链重复结构,可结合CAAT box和SV40核心增强子序列过去认为二聚体之间亮氨酸与亮氨酸是交错连接,像“拉链”一样,而现在认为亮氨酸与亮氨酸是相对连接的 (4) 螺旋-环-螺旋 螺旋螺旋-环环-螺旋螺旋(helix-loop-helix,HLH)蛋白的特点是,两段由15~16个氨基酸组成的双亲性α-螺旋通过一段环状的结构相连接,具有结合DNA的螺旋区和形成蛋白二聚体的能力(图 12-16)HLH长度共为40~50个氨基酸,两条双亲性α-螺旋的一侧有Leu和Phe等疏水氨基酸,两条链依赖疏水氨基酸的相互作用形成同二聚体或异二聚体,螺旋区含有各种保守的残基,两个α-螺旋之间的连接环长度不等,一般为12~28个氨基酸HLH结构域前面一段是15个氨基酸的碱性氨基酸序列,与DNA结合,其中有6个氨基酸为碱性在HLH中带有碱性区的肽链称为碱性HLH(basic HLH,bHLH)bHLH蛋白可分为两类:A类的bHLH 蛋白普遍表达,而B类的bHLH 蛋白只在特异性组织表达,如与骨骼肌发育相关的MyoD、myogenin和Myf-5等B类bHLH蛋白通常会与A类bHLH 蛋白形成异二聚体,缺乏碱性区肽链的HLH蛋白可以与碱性bHLH形成异二聚体,从而阻止bHLH与DNA结合,这样就大大增加了调控因子的多样性。
(5)同源异形结构域 同源异形结构同源异形结构域域 (homeodomain, HD)简称同源域,几乎存在于所有真核生物中其结合DNA的结构域中具有一段相同的保守序列,是60个左右氨基酸组成的螺旋-转角-螺旋结构的区域,晶体结构研究表明HD含3个α螺旋,其中碱性和疏水性氨基酸是比较保守的HD的N端插入DNA双螺旋的小沟,由17个氨基酸组成的第三α螺旋区域则进入DNA双螺旋的大沟,与碱基结合,第三螺旋区域中为数不多的氨基酸决定HD蛋白与DNA结合的特异性 12.5.2.2 转录因子的激活结构域转录因子的激活结构域 转录激活因子在结构上往往由两个或两个以上相互独立的结构域构成, 包括DNA结合结构域(DNA binding domain, DB)和转录激活结构域(activation domain,AD),它们是转录激活因子发挥功能所必需的单独的DB虽然能和启动子结合,但是不能激活转录DB的功能是通过结合DNA将AD带到启动子附近不同转录激活因子的DB和AD形成的杂合蛋白仍然具有正常的激活转录的功能例如,酵母细胞的GAL4蛋白的DB与大肠杆菌的一个酸性激活结构域B42融合得到的杂合蛋白仍然可结合到Gal4结合位点并激活转录。
转录激活结构域为蛋白质和蛋白质的相互作用提供场所,控制转录起始复合物的形成并调控其活性一般由20~100个氨基酸组成,目前将其大致分为三类: (1) 富含酸性氨基酸的结构域 这类结构域的特点是高度集中带负电荷的酸性氨基酸,大多为双亲性的α-螺旋结构,一侧富含酸性氨基酸,为亲水性的,另一侧含疏水性氨基酸如果用其它氨基酸替换带负电的氨基酸,转录水平明显降低反之,如果增加带负电荷的氨基酸,能提高靶基因的表达这说明激活转录的水平与所带电荷有关酵母转录激活因子GAL4就是一个典型例子,其转录激活结构域的49个氨基酸中,有11个酸性氨基酸 (2)富含谷氨酰胺的结构域 这类结构域的典型代表SP1结合在启动子上游的GC盒上,有两个富含谷氨酸的结构域,即两个转录激活结构域,其中活性最强的转录激活结构域谷氨酸占整个氨基酸的25%,另一个结构域的143个氨基酸中有39个谷氨酸 (3)富含脯氨酸的结构域 富含脯氨酸的结构域典型代表是CTF家族的转录因子,CTF主要识别CCAAT盒,它的转录激活结构域中84个氨基酸残基中有19个脯氨酸,脯氨酸占20~30%。
有些转录因子起始转录活性的能力很强,但并不具备上述描述的三种氨基酸AD的主要功能是通过与转录基本装置(转录基本装置(basal transcription apparatus)相互作用而激活转录水平 12.5.3 转录调控的作用机制转录调控的作用机制 顺式作用元件与反式作用因子相互作用而调控基因表达,使基因表达水平提高的称为正性调控(上调),使基因表达水平降低者为负性调控(下调)转录起始调控的实质是对RNA聚合酶活性的影响,反式作用因子通过以下不同的途经发挥调控作用:蛋白质和DNA相互作用;蛋白质和配基结合;蛋白质之间的相互作用以及蛋白质的修饰 RNA聚合酶II启动基因转录一般需要三种转录因子的帮助:通用转录因子、DNA结合的转录因子和辅助转录因子通用转录因子是RNA聚合酶起始任何基因的转录都需要的,DNA结合的转录因子主要与增强子或者UASs结合,辅助转录因子不直接与DNA接触,负责招募转录因子和转录起始复合物的组装通用转录因子已在第7章详细介绍,本节主要介绍DNA结合的转录因子和辅助转录因子12.5.3.1 转录因子之间的相互作用转录因子之间的相互作用 同一DNA序列可被许多不同的转录因子所识别,能直接结合DNA序列的蛋白因子是少数,多数转录因子是通过蛋白质-蛋白质作用与DNA序列联系并影响转录效率的。
转录因子之间或转录因子与DNA的结合都会引起构象的变化,从而影响转录的效率 酵母半乳糖代谢中GAL80和GAL4的相互作用就是很好的例子酵母半乳糖代谢调控和原核生物gal操纵中的调控形式是完全不同的:① 被调节的基因绝大部分都是位于不同的染色体上,不连锁② 起负调节作用的蛋白GAL80不直接和DNA结合,而是通过和作为转录激活因子的GAL4蛋白结合,占据其转录激活结构域来阻遏转录的③ 作为正调节因子不仅需要半乳糖作为诱导物,还需要GAL4蛋白作为转录因子,它不像原核生物的正调节蛋白仅与操纵子中的操纵基因结合,使整个基因簇得以转录,而是分别和各个被调节基因上游元件UAS结合,促进转录 GAL4蛋白有DNA结合功能域,又具有转录激活功能域,它以二聚体的形式结合于被调节基因上游特殊序列 (upstream activator sequence-galactose,UASG )上UASG由4个相同的17bp序列构成,每个序列都呈两侧对称,若GAL4和一个二聚体结合,那么转录激活是低水平的若4个序列都和GAL4结合的话,基因表达则可到最高水平GAL4的结构是利用功能区转换(domain-swapping)实验所证实的。
其中768~881氨基酸区域为转录激活功能区,可以和转录因子相结合,这个区域中的851~881区域又可特异地和GAL80蛋白相结合当半乳糖缺乏时GAL80就在此区域和GAL4相结合,占据了其转录激活功能区,而无法和转录因子结合,虽此时的GAL4仍可和UASG结合,但失去了转录激活能力,因此gal基因不转录当半乳糖存在时它可以和GAL80结合,可能使其构象发生改变,从GAL4上解离下来,这样GAL4又可以和转录因子相结合,恢复了转录活性的功能(图12-17) 真核生物的增强子即使距离它所调控的基因的启动子很远,却仍然可以发挥转录激活作用研究发现,DNA成环使得与远处增强子结合的激活蛋白质与结合在启动子上的TFIID,其它TFII组分及RNA pol II能够相互作用(图12-18) 基因转录的起始除了需要通用转录因子和结合DNA的转录因子外,有的基因转录过程还依赖于辅助激活因子这些因子通常不和DNA结合,而是连接转录因子和转录起始复合物或是一端连接转录因子,另一端和其他的辅助激活因子结合图12-19显示的是辅助激活因子GCN5-ADA2-ADA3起始酵母GAL基因的转录过程。
它一端与结合在USAs上的转录因子相互作用,另一端和结合在启动子上的通用转录因子和RNA聚合酶相互作用,协助转录起始复合物的组装,启动了GAL基因的转录同时,乙酰化转移酶HAT和染色体重塑复合物SWI/SNF及其它的调节因子也参加了这个过程的调节 12.5.3.2 介导因子介导因子 1990年,Roger Kornberg等发现一种酵母蛋白,可以通过介导转录因子与RNA聚合酶II的相互作用来增强基因的转录,他们把这种蛋白质称为介导因子((Mediator)) 研究发现介导因子不仅介导正性以及负性转录调节,也参与了基础转录过程介导因子不能直接结合DNA,但与RNA聚合酶II未磷酸化的CTD结合,形成完整RNA聚合酶II复合物(holoenzyme Complex),一旦转录开始,CTD磷酸化使得介导因子与RNA聚合酶II解离,RNA聚合酶II沿DNA延伸,而介导因子则参与新一轮的转录重复起始 酵母介导因子由21个亚基组成,包括SRB蛋白(suppressors of mutations in RNA polymerase B),MED(Mediator)蛋白等。
哺乳动物中有至少30种不同的MED亚基,人类细胞中发现的第一个介导因子复合物TRAP(Thyroid hormone receptor-associated protein)有很强的共激活因子活性酵母与其他物种介导因子的序列有广泛的同源性,表明在真核细胞进化早期就存在一种通用的介导因子复合物,也提示了介导因子的重要意义 酵母与人类介导因子复合物的电镜结构学研究表明,复杂的构象变化是介导因子传递正性和负性转录调控信号的基础由数十个亚基组成的介导因子复合物按一定顺序结合成较为致密的椭圆形结构,分为“头部”、“中间段”、“尾部” 和“CDK段”当与RNA聚合酶II或CTD结合时,介导因子复合物伸展开来,最具保守同源性的“头部”主要与RNA聚合酶II相互作用相对变异较大的“尾部”结构主要与特异性转录因子结合CDK段”的招募则导致CTD磷酸化,PIC解体,因而CDK拮抗其余介导因子复合物参与PIC的形成 此外,从广义上讲还有一些蛋白质过去定义为介导因子,目前归于“辅助激活因子”似乎更为恰当(见12.5.4)在原核生物中,cAMP与激活因子CAP结合后形成的cAMP-CAP可以激活基因的转录。
研究发现,cAMP也以间接的方式参与真核生物基因的转录活化cAMP浓度增加,激活蛋白激酶A(PKA),活化的PKA进入细胞核内,使cAMP应答元件结合蛋白(cAMP response element-binding protein, CREB)磷酸化,磷酸化的CREB结合在cAMP应答元件上,激活相关基因的转录有一种CREB结合蛋白(CREB binding protein, CBP),结合磷酸化的CREB的能力比非磷酸化的CREB能力强,与磷酸化的CREB结合后,可以招募转录因子组装成转录起始复合物,使CREB与转录起始复合物相连,因此,CBP被定义为一种“介导因子”随后,SP1的“介导因子”CRSP(cofactor required for SP1 activation)也被分离得到另外,CBP还参与促分裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)的磷酸化和活化过程活化的MAPK进入细胞核,激活AP-1中c-Jun的磷酸化,CBP蛋白结合活化的转录因子AP-1,介导靶基因的表达同时,CBP蛋白还有组蛋白乙酰化酶的活性,可以催化组蛋白的乙酰化,使DNA处于松弛状态,解除组蛋白对转录的抑制。
12.5.3.3 真核生物的转录阻遏真核生物的转录阻遏 一般说来,真核生物在转录水平的调控主要以正调控为主,而抑制作用主要通过控制染色质的结构来实现但也有一些调节蛋白可作为转录抑制因子干扰RNA聚合酶和转录因子之间的相互作用,阻遏基因的表达 真核生物的阻遏蛋白的作用机理有以下几种:有些与特异的启动子元件结合以后,占据了激活蛋白的作用位点,阻止了转录前起始复合物的组装;有些作为转录因子或者辅助激活因子的抑制蛋白,拮抗它们的转录激活功能;有些结合在启动子的下游,阻止RNA聚合酶的转录因此,真核生物转录水平的调控对细胞活性的影响也是正调控和负调控平衡作用的结果 实验显示,有的转录因子具有双重功能例如,糖皮质激素受体,一方面与特异的DNA序列结合后可以激活类固醇激素相关基因的转录,一方面也能够与另一个相关基因的DNA特异位点相结合,抑制它的转录 12.5.4 固醇类激素对基因转录的调控固醇类激素对基因转录的调控 激素对基因调控作用的轮廓是激素-受体-作用位点,三者缺一不可固醇类激素受体成员包括雌激素受体、雄激素受体、视黄酸受体、糖皮质和盐皮质激素受体、甲状腺激素受体、维生素D受体。
固醇类激素受体属于核受体核受体(nuclear receptor,NR)超家族的重要成员目前核受体超家族已有49个基因和75个以上核受体蛋白核受体为依赖配体的转录因子,对转录的调控涉及以下几个方面:① NR与基因组内的特异性调节位点相结合② 以配体依赖的方式招募共转录激活因子、修饰染色质及其相关蛋白③ 调节RNA聚合酶II在启动子的结合与功能④ 终止或削弱NR依赖的信号传导固醇类激素受体通过对基因转录的调控影响生长、增殖、分化等细胞生命活动的方方面面 12.5.4.1 固醇类激素受体识别特异的应答元件固醇类激素受体识别特异的应答元件 固醇类激素受体可识别靶基因DNA上专一的受体结合位点,即激素受体元件激素受体元件(hormone response element,HRE), HRE由两个很短的,排列为回文结构或同向重复结构的半位点(half site)重复序列组成HRE可以具有多个拷贝,拷贝之间具有协调效应HRE可位于基因的不同部位,如启动子的上游或下游数千碱基对之远,无方向性其半位点排列的方向以及间距等均可决定不同固醇类激素受体与HRE结合的特异性根据这些特性,固醇类激素受体大致分为两类: (1) 糖皮质激素糖皮质激素(glucocorticoid, GR)、盐皮质激素盐皮质激素(mineralocorticoid, MR)、雄激素雄激素(androgen, AR)和孕激孕激素素(progesterone, PR)受体都形成同源二聚体。
与这些受体结合的典型HRE半位点均含有同源保守序列TGTTCT,并以回文结构排列,又称为GRE类结合位点:TGTTCTNNNAGAACA雌激素(estrogen,ER)受体的作用方式与此类相似,只是半位点保守序列为TGACCT (2)9-顺式-视黄酸(9-cis-retinoid acid,RXR)受体可形成同源二聚体,也可以与甲状腺激素受体(T3R)、维生素D受体(VDR)等15种其他受体形成异二聚体,其结合位点称为TRE类异二聚体所识别的半位点序列为TGACCT,以同向重复结构排列不同二聚体对TRE类位点的识别依赖于两个半位点之间的距离,如RXR同源二聚体半位点间距为1bp,RXR-VDR为3bp,RXR-T3R为4bp,RXR-RAR为5bp 由于同一类HER中序列的相似性,在体外可能与多种受体蛋白有不同程度的交叉反应而在体内,这种反应的特异性及其对靶基因的活化,会受到不同层次多种因素的影响,如HRE拷贝数、HRE邻近区域的染色质修饰状态、辅助激活因子的参与等 12.5.4.2 固醇类激素受体的结构固醇类激素受体的结构 固醇类激素受体具有共同的结构特点,即三个独立的结构域:激素结合结构域、DNA结合结构域和转录激活结构域。
一个典型的核受体分子从N端至C端可细分为A~F功能区(图 12-20) A/B区(激活转录域)的可变性最大,其中部的非配体依赖性转录激活基序称为激活功能元件-1(activation function-1,AF-1),该区特定位置的酪氨酸和丝/苏氨酸残基能受不同信号转导通路相关激酶作用而磷酸化,从而影响受体与配体的亲和力和转录活性,不同受体之间此区的同源性小于15% 中段C区为DNA结合区, 由66~68氨基酸构成两个II型锌指结构,同源性较高为94~42%每一个锌指结构有不同的功能,第一锌指主要识别并结合DNA的特异性序列,第二锌指识别DNA结合序列中两个半位点之间的距离第一锌指结合DNA的功能主要通过一个叫做“特异性切换”的实验所证实,雌激素受体中的第一锌指被剪除,并由糖皮质激素受体中的第一锌指替代,新形成的受体蛋白只能识别糖皮质激素受体应答元件(Glucocorticoid receptor response element,GRE),而不能识别雌激素受体应答元件(Estrogen receptor response element,ERE),比较这两个激素受体的第一锌指氨基酸序列以及点突变研究进一步证实了第一锌指对DNA识别的特异性作用。
D区具有铰链连接功能,使得核受体蛋白分子有一定的柔性,能形成核受体二聚体并与DNA结合,两个受体蛋白分子以二聚化形式与DNA结合,符合其结合位点DNA序列为回文结构或同向重复结构的特征 E区为多功能区,包括配体结合域(ligand-binding domain, LBD)、二聚体形成区和配体依赖性转录激活基序,又称为激活功能元件-2(activation function-2,AF-2),同源性为57~15%E区还介导与热休克蛋白的相互作用,含有核定位信号一些核受体还有F区,尚不知该区的功能 晶体结构分析发现固醇类激素受体LDB结构具有高度保守性,由10~12个α-螺旋折叠而形成一个疏水的配体结合空腔LBD最C端的第12号α-螺旋在不同配体(激活剂或拮抗剂)作用下产生不同构象变化这种构象变化是激活剂或拮抗剂结合的受体招募辅助激活因子或辅助抑制因子的分子基础 脂溶性的固醇类激素可以通过自由扩散透过细胞膜,与细胞质中的受体特异性的结合当固醇类受体与激素结合后,受体蛋白将发生结构变化而被激活,活化的激素-受体复合物进入核内,与特异的DNA相结合,启动靶基因的转录(图12-21)。
12.5.4.3 固醇类激素受体对基因转录的调控固醇类激素受体对基因转录的调控靶基因上激素-受体复合物特异性结合的DNA序列,即激素应答元件HRE,常常起到增强子的作用 受体蛋白和配基结合后,形成二聚体活化的激素-受体复合物本身并不能促进基因转录,它必须和其他转录因子协同作用才能促进转录受核受体调节的基因,其启动子部位除有HRE、TATA盒外,还有多个其他转录因子的结合位点如在MMTV-LTR的启动子序列中,HRE和TATA盒之间还有一个核因子(nuclear factor 1,NF1)的结合位点及二个相邻的八聚体转录因子(octamer transcription factor I,OTF-I)的结合位点这些位点的突变或在转录体系中除去NF1或OTF1,将显著降低糖皮质激素受体或孕激素受体诱导的基因转录水平,说明这些转录因子在核受体激活基因转录过程中是必需的另一方面,核受体也使这些转录因子与DNA结合更为紧密 与相应激素结合后,糖皮质激素受体或孕激素受体与HRE结合促使染色质结构发生改变,在启动子部位出现DNAaseI高敏区在染色质结构改变过程中,组蛋白乙酰化导致核小体解聚可能是一个关键步骤。
染色质结构改变使染色质由非活性状态向活性状态转变,并允许NF1等转录因子结合到DNA上,可能也使TFIID易于结合到TATA盒上而形成稳定的转录起始前复合物,从而促进基因转录例如,当糖皮质激素进入细胞后,在细胞质中与受体蛋白结合,使受体蛋白构象发生改变,形成二聚体,成为活化状态,暴露核定位信号,然后进入细胞核,识别糖皮质激素应答元件(GRE)的保守DNA序列,从而活化了其下游基因的启动子,使糖皮质激素调节的基因开始转录,生成各种相应的蛋白 一些固醇类受体如TR,在配体缺失的情况下,可直接与DNA结合,招募负调控因子,通过去乙酰化等机制抑制转录GR介导的负调控则需要糖皮质激素的作用,结合特定的负调控GRE,通过对抗其他转录因子的活性,竞争性耗竭共激活因子等机理来抑制转录活性 12.5.4.4 辅助调节因子辅助调节因子 辅助调节因子辅助调节因子(coregulators)指除转录因子以外的所有能增强或抑制转录,但不直接与DNA结合的调节蛋白,包括辅助激活因子辅助激活因子(coactivator)和辅助抑制因子辅助抑制因子(corepressor)近十余年来,所发现的共调节因子总数已有两百余种,形成了一个庞大的家族。
回顾核受体(NR)研究领域的发展,不难看出,对NR复杂功能机制的了解依赖于对共调节因子的逐渐认识1975年只知道NR可以促进mRNA转录,并认为是直接作用于RNA聚合酶II到了1990年代初,对HER和GTFs有了清楚的了解,开始认识到一些未知的因子(称为Adaptor protein)介导并稳定NR与GTFs的相互作用,促进转录直到最近,对NR介导的复杂转录机制才有了较为全面的认识(图12-22)NR的作用是找到靶基因,招募一系列共调节因子复合物,这些具有不同酶活性的共调节因子复合物有序的加入并参与了转录的起始、延伸、终止,甚至mRNA的剪接 1995年第一个人类核受体辅助激活因子SRC-1(steroid receptor coactivator-1)在美国科学院院士O’Malley教授的实验室发现并克隆随后,SRC家族的其他成员,SRC-2,SRC-3被陆续发现SRC-1共激活因子能与PR、GR、TR、RXR、VDR等核受体相互作用,增强这些受体介导转录激活的效应,并且其作用是配体和AF-2依赖的SRCs中心区含有由三个LXXLL基序组成的受体作用结构域受体作用结构域(receptor interacting domain,RID;或者nuclear interacting domain, NID),RID使SRCs 与已结合配体的核受体的 AF-2区连接。
许多共调节因子都有一个或多个拷贝的LXXLL基序,对这些共调节因子与核受体AF-2 区之间相互作用至关重要SRCs还具有保守的C端转录激活结构域,介导与p300/ CBP或蛋白精氨酸甲基转移酶的相互作用 (图12-23)SRC家族成员的功能,至少部分是因其募集p300/ CBP复合物,将它们与活化的核受体连接起来 包括SRC家族成员在内的其它一些共激活因子还能与多种核受体N端的AF-1区相互作用,这种相互作用并不依赖于LXXLL基序,而是与共激活因子中富含谷氨酰胺的结构域有关因此辅助激活因子与AF-1和AF-2区的结合具有协同效应12.6.1 可变剪接可变剪接 大多数真核基因转录产生的mRNA前体是按一种方式剪接产生出一种mRNA,因而只产生一种蛋白质但有些基因产生的mRNA前体可按不同的方式剪接,产生出两种或更多种不同的mRNA,称为可变剪接或者选择性剪接(alternative splicing)1977年,Walter Gilbert提出可变剪接概念到目前为止,一共发现了数百种有可变剪接的基因,推测在高级真核细胞生物约5%的基因有可变剪接 选择性剪接主要有四种类型,外显子跨跃(exon skipped)或外显子缺失,即在剪接时将某个外显子切除;外显子延长(exon extended),即某些内含子的一部分被保留下来,使外显子的长度增加;内含子保留(interon retaied),即在接接时保留了某个内含子;外显子交替 (alternative exons)即不同的剪接产物选择了不同的外显子(图 12-24)。
1980年David Baltimore在大鼠IgM基因发现第一个可变剪接,其末端最后两个外显子的可变剪接,决定了所编码的IgM为膜型或分泌型大鼠免疫球蛋白重链的膜型和分泌型,主要区别在羧基端,膜型的羧基端为疏水性的,可以结合在膜上,而分泌型的羧基端是亲水性的,不能结合在膜上实验发现,这两种蛋白是由同一个mRNA通过可变剪接产生的,大鼠IgM基因有两个终止转录的信号和终止翻译的密码子,终止密码子I前是一段编码亲水性肽段的区域,终止密码子II前是一段编码疏水性肽段的区域如果在终止密码子I处终止转录和翻译,则产生分泌型的抗体如果在终止密码子II处终止转录翻译,则产生膜型的抗体一种mRNA前体,通过可变剪接,可以产生两种成熟的mRNA,分别编码两种蛋白质 另一个著名的例子是果蝇性别决定系统(图 12-25)在此系统中,至少3个基因,Sex-lethal(sxl), transformer(tra), Doublesex(dsx) 转录体的可变剪接级联反应最终决定了果蝇雄性和雌性性别特征的表达Sxl基因有8个外显子,tra基因有4个外显子,dsx基因有6个外显子。
在雌性中,Sxl基因以雌性方式被剪接,剪接产物为外显子1-2-4-5-6-7-8,从而产生有活性的Sxl蛋白有活性的Sxl蛋白又导致了性别转换基因tra以雌性方式进行剪接,剪接产物为外显子1-3-4,产生有活性的tra蛋白tra蛋白诱导了性别转换基因-2以雌性方式进行剪接产生tra-2蛋白tra-2蛋白使dsx基因以雌性方式剪接,剪接产物为外显子1-2-3-4,形成雌性特异的dsx蛋白,这种蛋白抑制雄性基因的表达导致雌性的发育 在雄性中,Sxl基因以雄性方式被剪接,剪接产物为8个外显子的mRNA,外显子3中有一个终止密码子,所以产生较短的没有活性的sxl蛋白由于sxl蛋白没有活性,则tra以雄性方式进行剪接,剪接产物为4个外显子的mRNA,外显子2中有一个终止密码子,所以产生较短的没有活性的tra蛋白没有sxl和tra的产生,所以雄性dsx以雄性方式进行剪接,产生外显子1-2-3-5-6的剪接产物,产生了雄性特异的dsx蛋白,导致了雄性的分化 单独一个基因通过可变剪接产生的十几种剪接异构体的现象很常见有些基因甚至能够产生成千上万种剪接异构体,各个不同的转录异构体编码结构和功能不同的蛋白质,分别在细胞、个体分化发育的不同阶段,在不同的组织,有各自特异的表达和功能。
可变剪接是从相对简单的基因组提高蛋白质组多样性的重要机制,蛋白质组的多样性与多细胞高等生物的复杂性相适应图12-26为快骨骼肌肌钙蛋白T的基因排列,在外显子4~8中,可任意选择0,1,2,3,4或5个,有32种可能的组合在外显子16和17中,可任意选择1种,故可形成64种表达产物 可变剪接位点的选择受结合到非剪接位点RNA元件和剪接因子的多重调节参与可变剪接调节的RNA元件包括外显子剪接增强子(exon splicing enhancer,ESE)、内含子剪接增强子(intron splicing enhancer,ISE)、外显子剪接沉默子(exon splicing silencer,ESS)和内含子剪接沉默子(intron splicing silencer,ISS)剪接因子包括富含丝氨酸和精氨酸蛋白(serine/arginine-rich protien, SR),和hnRNP家族蛋白等多种因子SR和外显子剪接增强子结合,可招募拼接因子(splicing factor, SF),使剪接可以依次进行,很少将某个外显子跨过去SR蛋白的存在与否或活性高低,与是否发生可变剪接相关(图12-27)。
SR-蛋白N端有一两个RNA识别结构域,C端有富含丝氨酸(S)和精氨酸(R)的结构域,可以识别ESE等剪接位点通过基本的剪接信号与蛋白因子、外显子和内含子上的增强子、沉默子与蛋白因子及蛋白因子与蛋白因子之间的相互作用来精确确定剪接增强子多位于它们所调节的剪接位点附近,有助于吸引剪接因子到剪接位点上,变更它们的位置可使剪接活性发生很大改变,甚至使它们转变成为负调控元件一类富含嘌呤核苷酸的ESE 是最常见的一种剪接增强子如果蝇的dsx 基因的第四个外显子中就存在这么一个ESE,通过促进对较弱的3'-剪接位点的作用而促进上游内含子的剪切调控因子Tra 、Tra2 和两个SR 蛋白结合其上,从而促进了U2AF 结合到前面的3'-剪接位点完成剪接在雄性个体中没有Tra 的表达,此时第四外显子被跳过 再如果蝇的fruitless 基因在雄性个体中较上游的5'-剪接位点发生剪接,而在雌性个体中,Tra ,Tra2 和SR 蛋白结合到ESE 上促使U1 结合到较下游的5'-剪接位点发生剪接 ,ESE 也可以同时促进较弱的5'-和3'-剪接位点参与剪接反应 12.6.2 反式剪接反式剪接 内含子的剪接一般都是发生在同一个基因内,称顺式剪顺式剪接接(cis-splicing),但也有使不同基因的外显子相互连接的,称反式剪接反式剪接(trans-splicing)。
反式剪接的较少见,典型的例子是锥虫表面糖蛋白基因(variable surface glycoprotein,VSG),线虫的肌动蛋白基因(actin genes),和衣藻(chlamydomonas)叶绿体DNA中含有的psa基因 1982年Von der Ploeg等人发现在锥虫(Trypanosome)中许多mRNA的5'-端都有共同的35b前导序列,但在每个转录单位上游并未见其编码序列1986年Murphy和Sutto证实这种前导序列来源于基因组中位于别处的重复序列(200个)所转录的小片段RNA,每个重复单位长135nt,前面35nt为外显子,后面100nt为内含子,有典型的真核生物5'-端剪接位点 因为这两段序列是反式结构,所以形成Y型中间体而不形成套索环,用去分枝酶处理就可以得到两个片段切下的5'-外显子,即35nt的前导序列的3'端可以再进行第二次转酯反应(图12-28) 前面35nt的前导序列可以通过转酯反应加到VSG mRNA的5'-端,其反应机制和核mRNA内含子的剪接相似 在VSG mRNA右侧内含子上有分枝点位点,可以和重复序列的内含子相连接。
虫的肌动蛋白基因中也存在类似的情况三种肌动蛋白的mRNA(和某些其它的RNAs)在5'-端有相同的22b的前导序列这个前导序列并不是由肌动蛋白基因编码的,而是长100b单独转录的RNA的一个部分反式剪接的5'-端外显子称为剪接引导RNA(spliced leader RNA,SL RNA)SL RNAs存在于几种锥虫和线虫中,它们具有共同的特点,即大约100bp,折叠成相同的二级结构,有3个茎环和1个单链区,此单链区类似于U1的Sm蛋白结合位点因此SL RNAs存在和snRNPs相似的形式,可能作为snRNP中的一种锥虫具有U2、U4和U6 snRNAs,但没有U1和U5 snRNAU1snRNA的缺乏可通过SL RNA的特点加以解释即SL RNA和U1 snRNA一样具有可以和内含子5'-端剪接位点识别和结合的功能SL RNA的另一特点是高度甲基化形成帽子结构Mandelboim 等报道对SL RNA突变分析,突变SL RNA 失去高度甲基化形成帽子结构的能力,结果发现该突变体不能正常地完成反式剪接 SL RNA的反式剪接反应可能表现了核内剪接装置的进化,SL RNA提供了顺式剪接中识别5'-剪接点的能力,这可能依赖于RNA的特殊构象。
在mRNA剪接中是由独立的snRNAs所提供的,无需像U1 snRNASL RNA这样的无蛋白就能执行剪接的功能表明5'-剪接位点的识别是直接依赖于RNA在反式剪接中至少两步需要有SR蛋白的参与,在U2 SnRNP加到3'-端受体之前和之后,SR蛋白发挥重要作用,主要是通过SR蛋白的RS区磷酸化来触发已和U2 SnRNP结合的SLRNA反式剪接 有的叶绿体基因也存在反式剪接,衣藻叶绿体的psa(photosynesizer)基因含有3个分散的外显子外显子1离外显子2为50Kb,离外显子3为90Kb,很多别的基因位于这3个外显子之间由于外显子1的转录方向和外显子2相反,即模板链不同,所以有时不能作为一个共同的转录本进行表达其实,转录本是由单个外显子转录而成的那么它们共处在一个mRNA上可能是通过2次反式剪接,连接而成其它的反式剪接与此相同,mRNA都是一个复合体 人体中已知有4 个细胞色素P450 3A 基因:CYP3A4 、CYP3A5 、CYP3A7 和CYP3A43,都有很高的相似性,由13 个外显子组成,并有保守的外显子-内含子边界,在第七染色体中成簇存在。
Finta和Zaphiropoulos发现CYP3A mRNA 是个嵌合体,是由CYP3A43 的第一外显子连接到CYP3A4 或CYP3A5外显子上而形成的由于CYP3A43 与CYP3A4 和CYP3A5 是头对头排列的,因此通常的绕过转录终止点的剪接机制不能解释这一现象,可能的机制是反式剪接将相互独立的mRNA 上的外显子连接成为一个转录单位,而且这一过程并不影响多聚腺苷酸的形成,这或许又是一种mRNA 的选择性剪接机制 12.6.3 RNA编辑编辑 基因转录产生的mRNA分子中,由于核苷酸的缺失,插入或置换,基因转录物的序列不与基因编码序列互补,使翻译生成的蛋白质氨基酸组成不同于基因序列中的编码信息,这种现象称为RNA编辑编辑(RNA editing)RNA编辑是指在mRNA水平上改变遗传信息的过程RNA编辑是通过比较成熟的mRNA插入、缺失或核苷酸的替换而改变DNA模板来源的遗传信息,包括U→C,C→U;U的插入或缺失、多个G或C的插入等RNA编辑同基因的选择剪接或可变剪接(alternative splicing)一样,使得一个基因序列有可能产生几种不同的蛋白质,RNA编辑的结果扩大了遗传信息,这可能是生物在长期进化过程中形成的、更经济有效地扩展原有遗传信息的机制,使生物更好地适应生存环境。
迄今为止,在真核生物的tRNA、rRNA 和mRNA 中都发现了RNA 编辑的现象RNA 编辑有核苷的插入或删除编辑和碱基替换编辑两种类型 1986 年荷兰Benne 发现原生动物锥体虫线粒体的细胞色素C 氧化酶第二个亚基(cox Ⅱ)的基因经转录后插入了4 个非编码的尿嘧啶,他们将这种RNA 加工的现象定义为RNA 编辑在锥体虫线粒体和叶绿体某些成熟的mRNA 序列中,甚至一半以上的核苷酸产生于RNA 编辑过程编辑所需精确的插入位点和准确的核苷数目是由引导引导RNA (guide RNA,gRNA)介导完成的gRNA分子是线粒体基因转录的约55~70b的RNA,这些小的gRNA 分子是与被编辑的mRNA互补的一小段反义序列,一般可与被编辑的mRNA一级转录本的下游编辑位点处结合形成短的(10~15bp) 锚定双螺旋由编辑复合体蛋白中的编辑位点特异性内切酶识别mRNA/gRNA形成的锚定双螺旋序列,在mRNA 3'-端第一个未配对的核苷酸处切开,接着末端尿嘧啶转移酶( TU2Tase) 将尿嘧啶残基加到切开的前体mRNA 插入位点上,或者3'-尿嘧啶特异外切酶从切开的删除位点除去尿嘧啶残基。
最后,RNA 连接酶将两段切开的mRNA 连接起来通过这样编辑后的mRNA分子,比原来的mRNA分子增加或者减少了碱基U,在翻译成蛋白质时就相当于发生了移码突因 Rueter 等在1999 年发现RNA 编辑可以调控大鼠腺苷脱氨基酶(ADAR) 2 mRNA 的选择性剪接在人类基因组中,已经识别了3 种ADAR,ADAR1 和ADAR2 是广泛表达的,ADAR3 只在脑组织中少量表达ADAR2是ADAR 1 在mRNA 的编辑中,特异地将腺苷转变成为次黄苷生成的他们发现了由两个不同的选择性剪接过程产生的ADAR2 mRNA 产物其中1 种剪接过程选择了近处的受体位点,在ADAR2 编码区中加入了47 个核苷酸,改变了原来的编码框核酸序列分析表明其近处和远处的受体位点分别是AA 和AG,选择近处的受体位点必须通过ADAR2 的编辑功能将AA 转变成AI,AI 可以象AG一样被识别,证明RNA 编辑也可参与选择性剪接过程 哺乳动物载脂蛋白B (ApoB) 的RNA 编辑也是一个很好的例子哺乳动物载脂蛋白B基因(ApoB)的组织特异性表达,受到RNA 编辑的调节。
载脂蛋白在人体中有两种形式ApoB100和ApoB48,在肝脏中表达产物是ApoB100,在小肠中表达产物是ApoB48组织特异性的ApoB48是ApoB100在细胞核内转录后mRNA编辑的结果在小肠中ApoB100 mRNA由C→U 的编辑把第26 位外显子的2153 位编码谷氨酸的密码子(CAA) 变成了终止密码子(UAA),从而产生了ApoB48,编辑特异性发生在第6 666 位的胞嘧啶ApoB mRNA 的编辑过程受多种蛋白组成的编辑复合物介导,其中有催化活性的亚基称载脂蛋白B mRNA编辑蛋白催化亚基21 (ApoB mRNA editing catalytic subnit 1, APOBEC21) 12.6.4 RNA的转运的转运 真核生物成熟的mRNA必需从细胞核运输到细胞质中指导蛋白质的合成,转运是制约细胞内蛋白质表达的重要环节,该过程由核被膜核苷三磷酸酶水解核内核苷三磷酸以提供转运所需的能量实验表明几乎有一半的蛋白编码基因的初始转录产物一直留在核里面,然后被降解掉 有证据表明转录加工后的mRNA是以核蛋白复合物的形式被转运的,其中蛋白质因子主要是外显子连接复合物。
核RNA(snRNA)参与hnRNA的剪接,并在mRNA从细胞核运到细胞浆的过程中起关键作用hnRNA的加工过程中,剪接体是转运复合物形成的起始位点,剪接完成后转运复合物连接在外显子连接处,参与mRNA转运的蛋白质可以与之识别并结合当剪接体离开mRNA时,它仍留在连接处,实现mRNA的转运 mRNA转运出核需要有5'-端的帽子结构和3'-端polyA的尾巴结构,还必须与所有的剪接体成分完全脱离后才能被转运出核例如在剪接体滞留模剪接体滞留模型型(Spliceosome retention model)中,剪接体的装配与mRNA的输出相竞争,这样前体mRNA在经过剪接体加工的过程中,RNA滞留在核中,不能与核孔相互作用当加工完成后,内含子被切除了,mRNA从剪接体上解离下来一旦mRNA被转运出核,它在细胞质中的位置也是特异性的有的直接被运送到内质网,有的被运送到细胞浆正确定位后的mRNA就能在特定的位置指导蛋白质的翻译mRNA的定位与它3'-端非编码区UTR有关,为参与mRNA定位的蛋白质提供结合位点 12.7 翻译水平的调控翻译水平的调控 真核细胞基因转录的各种mRNA并不都能翻译成蛋白质,在不同细胞中有不同的mRNA得到翻译,结果就导致不同细胞具有不同的蛋白质。
翻译水平的调节主要是控制mRNA的稳定性、mRNA翻译起始的调控和选择性翻译 在海胆未受精卵中存在着较稳定的未活化mRNA,只有在受精后才能翻译,称母体mRNA,推测这种mRNA可能在未受精卵中被蛋白质遮盖,或被局限在某一特定区域而不能被翻译而在受精后从束缚中解放出来,开始合成蛋白质所以认为,真核细胞基因表达调节的一个重要途径是产生处于隐蔽状态的稳定性的mRNA,在一定条件下才能进行翻译 真核生物蛋白合成起始时,40S核糖体亚基及起始因子首先与mRNA模板近5'-端处结合,然后向3'-方向移行,发现AUG起始密码时,与60S亚基形成80S起始复合物,即真核生物蛋白质合成的“扫描模式”核糖体正确识别起始密码子并控制起始合成蛋白质的能力可影响蛋白质合成的起始和频率 12.7.1 mRNA稳定性对基因活性的影响稳定性对基因活性的影响 真核生物基因的翻译调控的一个重要作用是控制mRNA的稳定性原核细胞绝大多数的mRNA不稳定,靠其快速合成和快速降解来调整其基因表达以适应环境之变化真核细胞的mRNA相对来说稳定的多mRNA 的稳定性,即mRNA的半衰期,受内外因素影响而发生变化,而mRNA的稳定性变化会对基因表达产生调控。
因为mRNA半衰期的微弱变化都可能使mRNA的水平在短时间内发生1000倍甚至是更大的变化同时,mRNA 水平的调节比其它调节机制更快捷、经济,因此调节转录本的稳定性可能成为翻译水平调节基因表达的主要机制之一 真核mRNA 5'-末端帽子结构的功能有2个:① 保护5'-端免受磷酸化酶和核酸酶的作用;② 提高mRNA的翻译活性如果细胞内的脱帽酶被mRNA中的序列元件激活,导致帽子结构中m7G被去除,则mRNA会被降解已发现两种5'-末端帽子结合蛋白帽子结合蛋白(Cap-Binding Protein, CBP):一种存在于胞质中,即eIF4E另一种是存在于细胞核内的蛋白质复合体,称为5'-端帽子结合蛋白复合体端帽子结合蛋白复合体(CBP complex, CBC)eIF4E与m7GGDP结合的构像已被鉴定出来eIF4E α和 β亚基的8个弯曲的β片层结构在3个长的α-螺旋组装成一个凹陷的臂,凹面有一条长窄的帽结合槽槽中有两个具有保守性的色氨酸侧链可以识别m7G,并将其夹在中间鸟嘌呤可以通过3个氢键与槽中一个保守性的谷氨酸的主链和侧链识别、结合, 还可以与另一个保守性的色氨酸以范德华力结合。
这种结构可以解释eIF4E与mRNA5'-端帽结构在翻译起始时怎样相互识别,也可以证明eIF4E与mRNA 5'-端帽结构结合后可以抑制Dcp1对5'-端帽子结构的降解 poly(A)尾部可缓减核酸外切酶对mRNA的3'→5'降解,在poly(A) 剩下不足10个A时,由于无法与poly(A)结合蛋白结合,mRNA便开始降解细胞质中poly(A) 的长度随着mRNA 的滞留时间而逐渐缩短,一些半衰期很短的mRNA,如C-fos, 其poly(A)的缩短异乎寻常地迅速对爪蟾卵等的研究发现,许多不同的mRNA经poly(A)化后具有更高的化学稳定性另一更直接的证据是,有人曾将一种很稳定的mRNA的poly(A)去除,结果其半衰期从原来的60多h,下降到只有4~8h 在某些真核细胞中,mRNA进入细胞质后并不立即进行蛋白质合成,而是与一些蛋白质结合形成RNP颗粒,使其半衰期得以延长mRNA的寿命越长,以它为模板进行翻译的次数越多家蚕的丝心蛋白基因是单拷贝的,但它的mRNA分子和蛋白质结合成为RNP颗粒而延长了寿命,真核细胞中mRNA的平均寿命通常为3h,而丝心蛋白的mRNA的平均寿命却长达4d,在几天内,一个细胞中可以合成多达1010个丝心蛋白分子。
mRNA的寿命还与同mRNA结合的蛋白质组分有关 另一个例子是转铁蛋白受体mRNA稳定性的变化铁离子是所有真核生物细胞必需的一种矿物质,然而高浓度的铁离子对细胞是有毒害的哺乳动物调节铁离子的浓度是通过两种蛋白质实现的:转铁蛋白受体和铁蛋白转铁蛋白受体可以携带铁离子从细胞外转运到细胞内,铁蛋白的功能是贮存铁如果细胞内铁离子的浓度太高,就会以铁蛋白的形式储存起来因此,当细胞需要铁离子的时候,就会增加转铁蛋白受体mRNA的表达,使更多的铁离子进入细胞,同时降低铁蛋白mRNA的表达,增加游离铁离子的数量如果细胞内铁离子浓度过高,则降低转铁蛋白受体的表达,提高铁蛋白的表达,从而降低细胞内铁离子的含量(图 12-29)当哺乳动物细胞中有高浓度铁离子存在时,转铁蛋白受体mRNA的半衰期大约是1.5h,而当铁离子浓度较低时,转铁蛋白受体mRNA的半衰期延长了30个小时,增加了20倍转铁蛋白受体mRNA半衰期的变化与其mRNA结构有关,位于3'-UTR中的铁离子应答元件介导了铁离子对转铁蛋白受体mRNA稳定性的调节 某些mRNA的稳定性还受细胞外信号(如类固醇激素)的影响。
当乳腺组织受到催乳激素的刺激后,酪蛋白的合成显著增加,而酪蛋白mRNA的合成仅增加了2~3倍,实验表明酪蛋白表达的增加不是由于酪蛋白mRNA转录速度的提高,而是酪蛋白mRNA半衰期的延长,即mRNA稳定性在激素作用后得以增加 在mRNA的3'-端非翻译区(UTR)含有一长段富含A和U的核苷酸序列,实验表明,含有AU区域的mRNA趋于不稳定,如果将一个不稳定的mRNA的AU区域置于一个稳定的mRNA的3'-端非翻译区,则重组mRNA变得不稳定,说明3'-端非翻译区与mRNA的稳定性有关其启动mRNA衰变的机理大致是:先激活某一特异核酸内切酶切割转录本,使转录本脱去poly (A )尾,使其对3'→5'核酸外切酶敏感,然后再激活下一步的降解过程例如,蚕蛹羽化成蛾后,需大量蛋白水解酶溶解蚕丝蛋白,蚕羽化前蚕丝蛋白mRNA半衰期达100小时,而其它时候仅变成2.5小时,利于维持蚕丝蛋白mRNA的水平,这可能与3'-UTR的作用有关 12.7.2 翻译起始阶段的调控翻译起始阶段的调控 蛋白质生物合成过程分为肽链的起始、延伸和终止三个阶段,翻译的限速步骤通常是起始阶段,包括多种调控方式。
12.7.2.1 隐蔽隐蔽mRNA mRNA的寿命通常很短,但有一种RNA寿命却相对很长,这就是隐蔽隐蔽mRNA(masked mRNA),它能与专一性蛋白结合而不被核糖体识别,通常只在受精后几分钟才开始翻译这是一种通过控制mRNA翻译的起始,来进行基因表达调控的机制隐蔽mRNA系在受精前贮存,不能启动翻译的mRNA在受精后招募激活因子,活化隐蔽mRNA,合成蛋白质,满足快速卵裂之需真核细胞mRNA相当稳定,可生存较长时间,例如,海胆卵mRNA直到受精后才转译,种子中的mRNA要到萌发时才转译,为什么出现这种现象?有人提出“隐蔽mRNA”理论:认为mRNA贮藏在由mRNA和核糖体以及一个蛋白质外壳组成的细胞质颗粒中,免遭酶的攻击而可长期保存,当有某种诱导因子时,除掉外壳进行翻译 12.7.2.2 阻遏蛋白的调控阻遏蛋白的调控 阻遏蛋白的负调控是原核生物转录水平上普遍存在的一种调节机制但在这里,阻遏蛋白的调控阻遏蛋白的调控指的是翻译水平控制翻译起始的一种机制,其中一个典型的例子就是编码铁蛋白的mRNA的翻译起始的调控 哺乳动物调节铁离子的浓度是通过两种蛋白质实现的:转铁蛋白受体和铁蛋白。
铁蛋白的功能是贮存铁由mRNA翻译产生铁蛋白的过程取决于铁离子的供应,它受到特异性的铁调控蛋白铁调控蛋白(iron regulatory proteins,IRP)的阻遏调控当细胞没有铁离子时,铁调控蛋白与铁蛋白mRNA启动子区域铁反应元(iron response element,IRE)的5'-UTR结合,阻止翻译进行当有铁存在时,IRP被修饰不再与IRE结合,从mRNA上解离,翻译得以启动另一方面,转铁蛋白受体mRNA稳定性的调节也在发挥关键作用 12.7.2.3 翻译起始因子的调控翻译起始因子的调控 在这一阶段存在各种调控方式,最主要的一种方式是起始因子的磷酸化目前研究较多的蛋白质合成的起始因子是真核翻译起始因子eIF,包括eIF1、eIF2、eIF2A、eIF2B、eIF3、eIF4A-F、eIF5和eIF6,它们通过磷酸化作用来控制翻译的起始,其中了解比较清楚的是eIF2和eIF4F (1)eIF2的磷酸化 蛋白质翻译起始于eIF2(一种异三聚体)的去磷酸化修饰,这一过程需要活化的eIF2B参与,eIF2B是一种由异五聚体构成的鸟嘌呤核苷酸交换因子(guanine nucleotide exchange factor,GEF),eIF2通过GTP与GDP之间的转换而开始反应,产生的eIF2-GTP与甲硫氨酰-tRNA结合,形成三元复合体。
在eIF3和eIF4的帮助下,三元复合体与40S核糖体亚基结合形成43S复合体,从而通过“扫描”找到AUG起始位点AUG的识别引发eIF5水解GTP,肽链合成起始于GTP的水解和eIF2-GDP及eIF4F的释放,上述两者都可参加下一轮的反应 当细胞受到某种压力的刺激,如病毒感染、营养匮乏或者热激,会激活某种激酶,磷酸化起始因子eIF2eIF2的磷酸化抑制eIF2B,不能将eIF2-GDP交换为eIF2-GTP,限制了eIF2-GTP的形成,抑制了eIF2的重新利用,阻断了蛋白质的翻译例如,兔的网织红细胞成熟时,细胞核被破坏,沉积在细胞质中的mRNA可以用于血红蛋白的补充当缺少血红素或者铁离子时,活化了血红素控制的抑制因子(heme-controlled repressor,HCR),使eIF2磷酸化,磷酸化的eIF2与eIF2B结合更紧密,使其不能将eIF2上的GDP转换成GTP,翻译起始被抑制 不过,并不是所有的eIF2磷酸化都起抑制作用,对某些基因mRNA的翻译却选择性的起强化作用例如,酵母在缺乏氨基酸的培养基中,eIF2磷酸化可以增强与合成氨基酸有关的基因的mRNA的翻译,降低其他蛋白质的合成,使酵母维持自身必需的蛋白质优先合成,适应环境的需要。
因此,eIF2磷酸化对基因表达的调控具有两面性 (2) eIF4及其结合蛋白的磷酸化 eIF4F是一种依赖RNA的ATP酶,促进mRNA与预起始复合物结合它有两个核心亚基(core subunits):eIF-4E为帽端结合蛋白,而eIF-4G通过C-末端与另一延伸因子e1F3(协助形成预起始复合物)及核糖体相连,N-末端则通过eIF-4E与mRNA的5'-末端相连eIF3和eIF-4E在eIF-4G的连接下,使核糖体富集于mRNA5'-端的帽子结构上磷酸化的eIF-4E与帽端结构的亲和力是非磷酸化形式的四倍,因此eIF-4E的磷酸化可以促进翻译起始 4E结合蛋白 (4E-binding proteins,4E-BPs)与eIF-4G的N-末端有相同的氨基酸序列,可竞争性地抑制eIF-4G和eIF-4E的相互作用,磷酸化可使4E-BP1失去与eIF-4E的结合能力许多胰岛素、分裂素和生长因子可诱导4E-BP1磷酸化,释放与之相连结的eIF-4E,使eIF-4E与eIF-4G相连,促进翻译相反,病毒感染却使4E-BPs去磷酸化,增强与eIF-4E的结合力,抑制翻译进程。
eIF-4E和eIF-4G结合后,通过eIF4F复合物的作用,使核糖体富集于帽子结构上,这对翻译起始是极为重要的 12.7.2.4 mRNA非编码区对翻译的影响非编码区对翻译的影响 1988年Pelletier和Sonenberg发现,在一个人工的双顺反子mRNA两个编码区域中插入脊髓灰质炎病毒(poliovirus,Pv)的5' -UTR序列能有效地引导第二个顺反子的翻译这表明该病毒非帽端结构的5'-UTR能指导mRNA的蛋白合成,但并不依赖于上游开放阅读框架的表达这种非依赖帽端结构的蛋白合成的模式,被称为内部起始模型它指的是核糖体结合到mRNA的内部区域,即直接结合到AUG或其上游的翻译起始表达过程,是针对多顺反子mRNA扫描模型的重要补充在此机制中,与核糖体相结合的5' -UTR序列被称为内部的核糖体进入位点(internal ribosome entry site, IREs) 5'-UTR序列一般位于5'-帽端结构后,其互补序列可形成稳定的茎环二级结构,阻止核糖体40S亚基的迁移,抑制核糖体预起始复合物沿着mRNA的运动,干扰起始复合物的扫描,作用的强弱则取决于发夹结构的稳定性及其在5'-UTR中的位置。
铁离子应答元件(Iron Responsive Elements,IREs)是一个在近帽子区域由28个核苷酸组成的茎环状顺式元件,在铁离子缺乏时,与反式作用因子铁阻遏蛋白(IRP)结合,使核糖体进程受阻,抵制其mRNA的翻译而铁离子浓度较高时,IRP则释放IRE,促进翻译5'-帽子近端的IRE / IRP复合物在空间上形成障碍,调节着翻译的起始在哺乳动物细胞中发现,IRE必须位于5'-末端的40个核苷酸位置内如果在帽子结构较远端,则由IRE / IRP亲和性产生的对翻译的调节不论在体内还在体外均会被削弱近帽子区域内的茎环结构比位于离AUG较近的茎环结构有更强的抑制作用,这可能主要与扫描所需要的从ATP水解获得的热动力驱动相关 5'-端非翻译区的长度也会影响到翻译的效率和起始的精确性当该区长度在17~80nt之间时,体外翻译效率与其长度成正比,该区域高极结构和高的G-C含量对翻译的起始都有妨碍5'-端非翻译区的二极结构妨碍调控蛋白与帽子结构的接近,阻碍40S前起始复合体的装配和在mRNA上的扫描,起负调控的作用但若二级结构位于AUG的近下游(最佳距离为14 nt),将会使移动的40S亚基停靠在AUG位点,增强起始反应。
真核翻译起始因子可使其二级结构解链,使翻译复合体顺利通过原二级结构区,继续其肽链的延伸,而不会起阻碍作用 起始密码子AUG的位置和其侧翼的序列对翻译的效率也有影响,这些因素主要是通过改变与调控蛋白、核糖体、RNA等的亲和性而影响起始复合物的形成,以致影响到翻译的效率如AUG上游-3位为A和下游+4位必须是G才能进行有效翻译,这一规律对动物和植物都是适用的侧翼序列之间的差异会影响mRNA翻译的效率,这对从多个上游AUG中寻找和确定起始密码子具有指导意义真核生物mRNA上通常有多个AUG,核糖体小亚基必须能够正确识别,一旦识别错误,干扰正常AUG启动的翻译,使翻译维持在较低水平如肿瘤生长因子TGFβ的mRNA的5'-非翻译区有11个AUG,核糖体与这些上游AUG结合,对TGFβ的翻译起负调控的作用 mRNA 3'-端的poly(A)不仅和mRNA穿越核膜的能力有关,而且影响到mRNA的稳定性和翻译效率,PolyA长度和翻译效率有关有人将poly(A)比做翻译的计数器,随着翻译次数的增加,poly(A)会逐步缩短Poly(A)对翻译的促进作用需要poly(A)结合蛋白(PABP)的存在,PAPB结合poly(A) 的最短长度为12nt。
当poly(A)缺乏PAPB的结合时,裸露的mRNA 3'-端易招致降解PAPB迁移到AU序列时,导致poly(A)的暴露促进了mRNA的降解帽子结构和Poly(A)都能通过与它们的共同靶蛋白eIF-4G相互作用,使40S小亚基富集于mRNA 此外,在mRNA 3'-端非翻译区一般都富含AU序列,由数个UUAUUUAU八核苷酸核心序列组成,称AUUUA序列这个序列对翻译效率有抑制作用,其抑制强弱取决于AUUUA序列拷贝数的多少,与距离终止密码子的远近无关一些短效细胞因子的mRNA内有AUUUA序列,在翻译了一定量的多肽后,立即将mRNA降解,以免过量表达影响细胞的正常状态 12.7.3 mRNA的选择性翻译的选择性翻译 原核生物中常通过操纵子来控制其合成相关蛋白的浓度,而在真核生物中不存在操纵子,所以就要采用选择性翻译的方式例如,α和β珠蛋白的合成珠蛋白是由两条α链和两条β链组成的但在二倍体细胞中都有4个α-珠蛋白基因,如果它们的转录和翻译效率相同的话,它们之间的浓度比应是α:β = 2:1,而实际上是1:1,那么是由于转录调控还是翻译调控使它们的产物达到了平衡呢?人们进行了以下的体外实验,在无细胞系统中加入等量的α mRNA和β mRNA以及少量的起始因子,结果合成的α-珠蛋白仅占3%,说明β-mRNA和起始因子的亲和性远大于α-mRNA。
当加入过量的起始因子时,α珠蛋白和β珠蛋白之比为1.4:1,接近1:1,表明是在翻译水平上存在差异,即与翻译起始因子的亲和性不同,这是由于mRNA本身的二级结构和高级结构所致 12.7.4 RNA干扰导致的基因沉默干扰导致的基因沉默 RNA干扰是指由双链RNA诱发的基因沉默现象当细胞中导入与内源性mRNA编码区同源的双链RNA时,该mRNA发生降解而导致与之同源的基因沉默,这种作用命名为RNA干扰干扰(RNAi)mRNA的编码链被称作正义链,与之互补的mRNA链则被称作反义链Fire和Mello给秀丽隐杆线虫分别注射编码一种肌肉蛋白质mRNA分子的正义或反义链后,线虫的行为均未受到明显影响,而当他们同时给线虫注射正义和反义mRNA时,线虫出现了奇特的颤搐运动,这种运动与完全缺乏肌肉蛋白功能基因的线虫相同,这说明什么呢? Fire和Mello推论:正义和反义RNA分子会结合在一起形成的双链RNA分子可导致基因沉默,他们将这种现象命名为RNAiRNAi仅能使与外源RNA分子编码相匹配的基因沉默,且这种作用可在细胞间传播,甚至被遗传 目前,发现具有功能作用的小分子RNA主要包括小干扰RNA (siRNA) 、微RNA (microRNA, miRNA)和piRNA (piwi-interacting RNA, piRNA) 3类。
siRNA是近年新近发现的具有21~23个碱基对的双链RNA,有2个碱基的黏性末端,在细胞中siRNA可由双链RNA内切酶处理而产生,具有扩增效应:siRNA可作为引物,以靶标mRNA为模板,在RNA依赖的RNA聚合酶的作用下,产生后代“次级”siRNA,并且启动一个RNA诱导的连锁反应miRNA是由核糖核酸酶III(Drosha)作用于约70 nt发夹状前体的1条链而来,所以miRNA 以单链形式存在,通过与靶标RNA 3'-端非翻译区不完全互补配对结合,而调节内源基因的表达,影响蛋白质的合成水平,从而调节生物的发育过程,但它并不影响mRNA的稳定性piRNA是一种能与piwi蛋白相互作用的小分子RNA,2006年由4个独立的研究小组在小鼠实验中分离得到的piRNA由30nt组成,可能与动物体精子发育和维持的功能相关 RNAi机制已被初步阐明(图12-30):外源性如病毒或内源性的双链dsRNA会首先结合到一种核酸内切酶(Dicer)上,随即被切割成21~23nt带有3' -端单链尾巴(多数是UU)及磷酸化的5'-端的双链短链,是RNAi的起始诱导物,即siRNA,这一过程也被称为干扰的起始阶段。
随后siRNA与Dicer形成引导沉默的复合体(RNA induced silencing complex,RISC)有一条RNA链会被清除,而另外一条仍与RISC复合体结合的RNA链即成为探测mRNA分子的探针siRNA作为引导序列,按照碱基互补原则识别靶基因转录出的mRNA,并引导RISC结合mRNA随后siRNA与在复合体中的mRNA换位,并在距离siRNA 3'-端12个碱基的位置切割mRNA,核酸酶Dicer将mRNA切割成21~23nt的片段,特异性地抑制靶基因的表达,造成基因沉默这个过程被称为RNA干扰的效应阶段而新产生的dsRNA片段可再次形成RISC,继续降解mRNA,从而产生级联放大效应因此,每个细胞只需要几个分子就能引起强烈的RNAi效应 MicroRNA是一种大小为21~25个碱基的非编码单链小分子RNA,是由具有发夹结构的70~90个碱基大小的单链RNA前体,经Dicer酶加工后生成的,它通过与靶标mRNA 3'-UTR互相匹配导致该mRNA的沉默 RNAi不仅是线虫基因调控机制的重要组成部分,也是人类基因表达调控的重要因素人类基因组中有数百种基因编码一种被称作microRNA的小RNA分子,microRNA的序列中包含其它基因的编码片段,这些microRNA分子可形成双链结构,并通过激活RNAi来阻断特定蛋白质的合成。
现已证实,microRNA介导的基因调控在生物体发育和细胞功能调控过程中均发挥着重要作用12.8 翻译后调控翻译后调控 蛋白质合成后通常还需加工、修饰和正确折叠才能成为有功能的蛋白质12.8.1 肽链中氨基酸的共价修饰肽链中氨基酸的共价修饰 已发现多达200多种的蛋白质修饰,包括:磷酸化、甲基化、乙酰化、糖基化、羟基化、酰基化和泛素化等蛋白质修饰几乎参与了所有的细胞正常生命活动过程,蛋白质翻译后修饰使得蛋白质的结构更为复杂, 功能更为多样,调节更为精细,作用更为专一蛋白质翻译后修饰是蛋白质动态反应和相互作用的一个重要分子基础,也是细胞信号网络调控的重要靶点,还与许多疾病的发生发展有关与此同时,以蛋白质修饰酶为靶标,开发影响蛋白质修饰的小分子化合物已经成为新型药物研发的重要途径之一例如,目前一系列去乙酰化酶的小分子抑制剂已经通过美国FDA批准成为了一类新的肿瘤治疗药物因此,对蛋白质修饰的基础研究,特别是研究蛋白质修饰在重要疾病发生、发展中的作用,已经成为当代生命医学研究的一个重要热点 目前研究较深入的蛋白质修饰方式之一是蛋白质的磷酸化,磷酸化是由蛋白激酶来完成的,是把ATP或GTP的磷酸基团转移到底物蛋白质氨基酸残基上的过程。
磷酸化蛋白质在发挥作用之后,需要被去磷酸化,以保持活性蛋白质的动态平衡,这一过程则是由蛋白磷酸酶来完成蛋白激酶可以分为两大类,一类是丝氨酸/苏氨酸蛋白激酶,参与多种信号转导过程另一类是酪氨酸蛋白激酶,在细胞生长、分化和转化中起重要作用蛋白激酶还可以通过蛋白质磷酸化的级联反应逐级放大信号,因此蛋白质磷酸化的调节在信号转导过程中有重要作用,是细胞生命活动的调控中心 细胞内信号传递作为分子开关的蛋白质可分两类:一类开关蛋白(switch protein)的活性由蛋白激酶使之磷酸化而开启,由蛋白磷酸酯酶使之去磷酸化而关闭,许多由可逆磷酸化控制的开关蛋白本身也是蛋白激酶,在细胞内构成信号传递的磷酸化级联反应,如蛋白激酶A(PKA)激活级联放大系统分解肌糖原的过程另一类开关蛋白主要由GTP结合蛋白组成,结合GTP而活化,结合GDP而失活 胶原蛋白是皮肤真皮的主要成分,占皮肤干重的80%,含有较多在其他蛋白质中少见的3-羟脯氨酸(3-hydroxyproline)和5-羟赖氨酸(5-hydroxylysine, Hyl),羟脯氨酸残基可通过形成分子内氢键稳定胶原蛋白分子。
胶原蛋白是由成纤维细胞合成的,合成的前体是原胶原分子,而后转入内质网中进行羟基化和糖基化修饰原胶原分子组成中含有羟脯氨酸和羟赖氨酸,这两种氨基酸并无遗传密码、反密码及tRNA引导入肽链,而是在内质网中,由脯氨酸羟化酶(prolyl hydroxylase)和赖氨酸羟化酶(lysyl hydroxylase)催化,脯氨酸、赖氨酸残基经羟化生成的胶原分子中含有共价连接的糖基,根据组织不同,糖含量可达0.4~12%其中糖基主要为葡萄糖、半乳糖及它们的双糖在内质网中由半乳糖基转移酶及葡萄糖基转移酶催化将糖基连接于5-羟赖氨酸残基上 蛋白质泛素化和类泛素化修饰是另一类重要的蛋白质翻译后修饰泛素是由76个氨基酸组成的小分子蛋白,在活化酶E1、载体蛋白E2和连接酶E3共同作用下,共价结合到底物靶蛋白分子(图12-31a),这样泛素化的底物可以被26S蛋白酶体降解为若干肽段(图12-31b)泛素激活酶E1可利用水解ATP释放的能量以其半胱氨酸残基(Cys)的巯基与泛素C端的甘氨酸残基(Gly)形成高能硫酯键连接在E1上的泛素然后被转移到泛素结合蛋白E2上,同时被选中的靶蛋白质与第三个组分即靶蛋白泛素连接酶E3结合。
E2然后将与其连接的泛素转移到靶蛋白上,并与靶蛋白赖氨酸残基(Lys)-NH2基团形成异肽键(isopeptidebond),E2被释放泛素化是细胞维持对那些受组成型调节和环境刺激产生的蛋白质水平的基本调节方式泛素-蛋白酶体途径是真核细胞内重要的蛋白质质控系统,参与调节细胞周期进程、细胞增生与分化,以及信号传导等多种细胞生理过程 泛素化修饰可分为多聚泛素化修饰(polyubiquitination)和单泛素化修饰 (monoubiquitination)通过泛素赖氨酸残基48(K48)形成的多泛素化(多于4个泛素)的蛋白底物被26S蛋白酶体迅捷降解进而调控细胞内底物蛋白浓度,而单泛素化或其他赖氨酸残基形成的多泛素化修饰一般不引起底物降解,但参与蛋白质活性调控泛素化修饰也是一个可逆过程,去泛素化由去泛素化蛋白酶(deubiquitinating enzymes, DUB)家族来介导 泛素化修饰是一种非常普遍的蛋白质修饰在酵母中,有高达20%蛋白质被泛素所修饰如何从许多蛋白质中识别与挑选必须降解的成员是一件复杂的工作,蛋白酶体中降解的许多动物蛋白质有特征性的基序,如人类蛋白Iκbα和β-catenin以及HIV病毒Vpu蛋白含有-Asp-Ser-Gly-X-X-Ser-顺序,细胞周期蛋白(cyclin)A、B1和B2含有识别顺序-Arg-Leu-Gly-X-X-X-Ile-Gly-,也是蛋白质磷酸化的位点。
因此,系统地鉴定泛素化修饰的底物,特别是通过高通量的技术手段与平台来发现全细胞泛素化修饰靶蛋白分子将是泛素化修饰研究领域中的一个重点与此并重的是,E3连接酶和去泛素化蛋白酶对蛋白质泛素化的调控E3连接酶决定底物的特异性据生物信息学分析,人类基因组中有1000多个E3连接酶,而其中只有不到25%的E3连接酶被报道从基因组数据库预估人类基因组中有95种DUB,但目前实验检测和报道的DUB亦不到1/3因此,尚有大量的E3连接酶和DUB需要鉴定 细胞内还存在包括SUMO、NEDD8等十余种类泛素化(ubiquitin-like,UBLs)修饰形式,其中SUMO修饰参与了对许多重要生命活动过程的调节,引起了较多的关注与K48多泛素修饰所不同的是,类泛素化修饰通常并不直接介导靶底物降解,而是通过影响靶底物与其他蛋白的相互作用、细胞内定位来调控其功能以SUMO修饰为例,其共价过程与泛素化相似,需要SUMO特有的E1(SAE1/SAE2),E2(UBC9)和E3,也可被去SUMO蛋白酶SENP介导其可逆过程被SUMO修饰的靶蛋白已报道有几百种之多,但依然不断有新的SUMO底物蛋白被发现。
所有蛋白质的SUMO修饰都共用一个E1和E2,但与底物特异性有关的E3只报道了10个,SUMO蛋白酶SENP亦只有6个因此当面对众多的靶蛋白时,是否需要有更多的E3参与底物的特异性选择?E3和SENP如何能够特异地调节靶蛋白的SUMO修饰?都将是这一领域中最富有挑战性的课题 不同的翻译后修饰方式并不是单独发生的,它们可以协同作用,共同控制着蛋白质的稳定性,从而增强蛋白质的生物学活性,大大扩展它们在信号通路中的功能在真核细胞中,泛素化和磷酸化可以相互作用而影响其蛋白质修饰方式如泛素在蛋白酶体降解途径中发挥重要的靶向作用,而细胞外信号严格调控着目的蛋白的泛素化在很多情况下,这种调控依赖于蛋白质的磷酸化由磷酸化影响的调控步骤可能与E3泛素连接酶对底物的识别有关,也可能与实际的交联反应有关这种调控可以通过对底物或E3连接酶本身的磷酸化实现 12.9 真核生物发育过程中的基因表达调控真核生物发育过程中的基因表达调控 真核生物发育过程中的基因表达调控是一个非常有吸引力的,复杂的研究领域近年来,以一些发育周期短,在实验室容易繁殖的模式生物为材料,已取得不少研究成果常用的模式生物有线虫、果蝇、斑马鱼、小鼠和拟南芥,其中果蝇的研究资料最为丰富。
果蝇的卵细胞和15个滋养细胞的外围有一层滤泡细胞,受精前,卵细胞和滋养细胞中的mRNA和蛋白质的分布有一定的极性受精后,细胞核每6min~10min同步分裂一次,形成多核体(syncytium),在第8~11轮分裂之间,细胞核迁移到卵细胞的外层,形成多核体胚盘(syncytial blastoderm),再分裂几轮后,膜内陷包围细胞核,形成胚盘,随后,细胞进行不同步的分裂在发育过程中,先后有母性基因、分节基因和同源异型基因3类调节基因发挥作用12.9.1 母性基因母性基因 母性基因母性基因(maternal)在未受精的卵细胞中转录,产生的mRNA在受精前处于静止状态母性基因的表达产物主要是基因表达的调控因子,可以确定卵细胞的前后轴和腹背轴 bicoid基因的mRNA由滋养细胞合成,主要分布在未受精卵细胞的前部,其表达产物Bicoid蛋白是前部形成素Bicoid蛋白可以激活许多分节基因的表达,也可以使某些mRNA失活缺少Bicoid蛋白的卵细胞会发育成有两个腹部,而缺少头部和胸部的胚胎 nanos基因的mRNA主要分布在卵母细胞的后部,其浓度从前向后逐渐增加,Nanos蛋白是一种翻译抑制因子。
其它母性基因的mRNA在卵细胞中均匀分布,其表达活性多数受Bicoid和Nanos的调控但也有一些母性基因的mRNA,如pumilio的mRNA,不受Bicoid和Nanos的调控,故Pumilio蛋白在卵细胞中均匀分布,Pumilio蛋白是一些基因翻译的抑制因子hunchback基因属于背部基因,其转录可以被Bicoid激活,hunchback mRNA的翻译则被Nanos和Pumilio抑制,使Hunchback蛋白的浓度从前向后逐渐下降Hunchback蛋白既可以由母性基因的mRNA翻译生成,又可以由发育的胚胎细胞表达生成,故hunchback基因既是母性基因,又是分节基因Hunchback蛋白是许多基因的转录调节因子,可以对有些基因进行正调控,对另一些基因进行负调控caudal即尾部基因,在Bicoid和Nanos的调控下,其表达产物Bicoid蛋白在胚盘的尾部浓度较高,Bicoid蛋白是能够激活后续发育阶段某些基因的激活因子Hunchback蛋白和Bicoid蛋白在胚盘中的极性分布,确定了胚胎发育的极性 12.9.2 分节基因分节基因 分节基因分节基因(segmentation)在受精后开始转录,表达产物可使胚胎形成体节。
果蝇的分解基因有3类,gap基因负责将发育胚胎分成几个大区域,其表达受母性基因的调控,gap基因的表达产物gap类蛋白包括Hb、Kr、Kni等,可调控其它分节基因和同源异型基因的表达pair-rule基因和segment polarity基因确定胚胎发育为14个体节,去除属于pair-rule类基因的fushitarazu(ftz)基因,则胚胎发育为7个体节,每个体节的宽度是正常体节的2倍研究发现,分节基因的表达产物可调控同源异型基因的表达 12.9.3 同源异型基因同源异型基因 同源异型基因同源异型基因(homeotic gene)负责在哪个体节形成何种器官或附肢,其表达产物为高度保守的转录因子家族果蝇有8个同源异形基因组成2个基因簇:触角足复合体(antennapedia complex)包括:labial (lab)、 proboscipedia (pb)、Deormed (Dfd)、 sex combs reduced (Scr)和 Antennapedia (Antp)五个基因;双胸基因复合体(bithorax complex)包括3个依次排列的基因:Ultrabithorax(Ubx)、abdominal-A(Abd-A)和abdominal-B(Abd-B)。
在体节的特异化方面,触角足复合体中的lab和Dfd作用于头节,Scr主要作用于第一胸节,Antp主要作用于第二胸节,双胸复合体中的Ubx对第三胸节的发育是必须的,abdA和abdB基因决定腹部的分化 小鼠的同源异形框(Homeobox,HOX)有38个,排列成4个分离的基因簇,称为HOXa、HOXb、HOXc和HOXd四簇(图12-32)人类有39个HOX基因,分为HOXA、HOXB、HOXC和HOXD四簇,分别位于染色体7 p14, 17q21, 12q13和2q31,每个基因簇含9~11个基因所有的基因都以3'→5'方向转录,每个基因簇中的多个基因序列相似、位置相邻每簇1~13 个基因位点沿DNA序列3'→5'依次排列,长约120 kb在果蝇与脊椎动物中,大多数同源异型盒基因串联排列成簇,每一同源家族的成员在哺乳动物胚胎中以相似的模式表达 HOX基因表达的蛋白质为同源域蛋白( homeodomain proteins),是一类转录调节因子HOX基因编码区的DNA 片段含183 kb,转录由61个氨基酸组成的同源结构域根据氨基酸序列分析,该基因所编码的蛋白质第42至50位氨基酸序列富含精氨酸和赖氨酸,呈螺旋-转角-螺旋的立体构型,这9个氨基酸片段被认为是与DNA相结合的区域,可对基因进行调控。
因此,HOX基因产物是可与DNA 结合的转录调节因子 HOX基因沿染色体的排列顺序与沿胚胎前后轴的表达之间存在共线性(colinear)关系其一是空间共线性,指HOX基因在染色体上的排列顺序,与HOX基因在靠近体轴的中胚层、神经管、后脑和附肢等处的空间限定的表达区排列顺序之间的共线性其二是时间共线性,指HOX基因在染色体上的排列顺序,与在胚胎发育过程中HOX基因表达的先后次序之间的共线性其三是HOX基因对维甲酸反应的共线性,染色体上位于3'-端的基因首先在胚胎前部表达,对维甲酸诱导的敏感性最高,由3'→5'方向,各基因在胚胎后部依次表达,且对维甲酸的敏感性逐渐降低总之,在同一个基因簇中,从3'→5'方向,HOX基因表达的时间依次延迟,表达区域沿前后体轴依次向后推移,对维甲酸的反应时间也依次延迟而且反应程度依次降低 在胚胎发育期,HOX基因3'→5'端的1~13 位点基因以时间先后,在特定的空间位置依次表达或静默靠近3'-端的基因在胚胎发育早期表达,促进细胞增殖和迁移,主要控制体轴近端的发育例如,小鼠位于3'-端的基因HOXa1和HOXb1,在胚胎发育早期表达,最终形成后脑。
5'-端的基因在胚胎发育晚期表达,促进细胞分化和凋亡,主要控制体轴远端和神经外胚层末端的发育,如形成尾椎,这称为HOX基因的时空共线性和前后轴HOX基因的时空共线性由表观遗传编码调控,组蛋白甲基化酶TrxG 和PcG通过组蛋白甲基化,控制HOX 基因1~13 位点DNA 序列在不同的时间点和严格的空间位置依次激活或静默,成为细胞发育的时间表 同源异型基因的突变,将引起脊椎骨和脊椎发育顺序的改变,导致胚胎发育过程中某一器官异位生长,即本来应该形成的正常结构被其他器官取代了例如,果蝇的同源异型基因Antp(触角基因)的突变,导致果蝇的一对触角被两只腿所取代小鼠HOX-8基因正常在胸腔和腰椎发育形成之间表达,第一个腰椎形成时并没有肋骨,然而该基因被敲除的小鼠,第一个腰椎形成时形成了一对发育不全的肋骨,典型的胸腔区域的脊椎骨却在腰椎区域发育形成了 同源异型基因的“时空”表达模式最初是由隶属于gap基因家族的编码蛋白决定的,gap类蛋白包括Hb、Kr、Kni等,是同源异型基因的直接抑制因子,维持特定细胞内的同源异型基因表达模式例如,果蝇的Abd-B基因主要在腹部发育晚期表达,包括第5到8体节原基的形成。
Abd-B基因表达在头部、胸部和前腹部的发育过程中分别被Hb、Kr、Kni等gap基因抑制同源异型基因表达的维持主要依赖于一种大的蛋白质复合体,称为PRC(polycomb repression complex)PRC结合在Abd-B基因的调控序列,引起组蛋白H3的27位Lys甲基化,抑制该基因的转录相反,激活复合体TRC(trithorax complex)结合在Abd-B基因的调控序列,导致组蛋白H3的第四位Lys甲基化,激活Abd-B基因的表达因此,在胚胎早期发育过程中,PRC和TRC共同作用,调节着同源异型基因按正常的模式表达 维甲酸( retinoic acid, RA)包括全反式维甲酸( ATRA)、3, 4-双脱氢维甲酸(ddRA)、9-顺式维甲酸,研究发现,维甲酸参与生物体的胚胎发育和器官形成,在生殖细胞分泌和维持机体正常生理功能方面都发挥着非常重要的作用在胚胎细胞内,维甲酸诱导的HOX基因的启动与HOX基因在簇内的定位具有共线性关系每一个HOX基因上都有维甲酸敏感的调节元件,但对维甲酸的敏感性逐渐降低在维甲酸作用的早期,首先启动的是定位于基因簇3'-端的HOX基因(如HOXa1, HOXb1),而远离3'-端的HOX基因(如HOXa7, HOXb7)对维甲酸的应答则进行性滞后,且其应答需要更高浓度维甲酸的诱导。
简言之,维甲酸诱导了胚胎细胞内HOX基因的“时空”协同表达 思考题思考题 1. 试述真核生物基因表达调控的特点 2. 真核生物基因表达调控的水平有哪些? 3. 组蛋白的乙酰化和去乙酰化有哪些生物功能? 4. 什么是染色质重塑?在真核生物基因表达调控中有何意义? 5. 简述DNA甲基化对转录活性的影响 6. 为什么说转录水平的调控是真核生物调控中最主要的调控环节?真核生物基因表达在转录水平上是如何调控的? 7. 什么是顺式作用和反式作用? 顺式作用元件和反式作用因子有哪些?各有何特点? 8. 描述增强子对转录的正调控作用机制 9. 反式作用因子与DNA结合结构域有哪几种? 10. 什么是辅助调节因子?它的作用有何特点? 11. 简述固醇类激素对基因表达调控的作用机理 12. 什么是选择性剪接,有哪些方式?有何不同? 13. 什么是蛋白质泛素化修饰?在基因表达调控中有何作用? 14. 概述真核生物发育过程中的基因表达调控。
