重组蛋白表达系统的选择19153.pdf
37页重组蛋白表达系统的选择、表达策略和方法学研究 张 宁 1. 前言 在生命科学的很多研究和应用领域中,如何获得大量、均一、高纯、有活性的蛋白质都是一个关键问题 现代重组蛋白表达技术为我们提供了多种选择: 传统的大肠杆菌、 酵母、昆虫和哺乳动物细胞表达系统以及较新的植物和体外表达系统 每种表达系统都有很多成功的例子,但重组蛋白的个性不尽相同,没有任何一个系统和方法是普遍适用的,为目的蛋白选择一个恰当的表达系统也就成为表达工作的重中之重 关于目的蛋白的一切信息,对表达系统的选择都是有帮助的,有几个最基本的问题一定要在表达之前回答清楚: 目的蛋白的来源是原核还是真核生物具有什么样的功能分子量和聚合状态是膜蛋白还是水溶蛋白胞内表达还是分泌表达是否需要以及需要何种翻译后修饰有没有配体、 底物或产物类似物可以利用对蛋白酶是否敏感有多少分子内及分子间二硫键对目的蛋白的表达量、活性、表达速度和成本有怎样的要求除了摸清目的蛋白的脾性,还要清楚各个表达系统的特点、优势和局限性,才能找到表达工作的大略方向,要获得最适合目的蛋白的表达方案,还需要在具体实验中调整优化。
表 1 比较了目前常用的表达系统的特点,并给出了粗略的适用范围 大肠杆菌 酵母 昆虫细胞 哺乳动物细胞 流程 简单 简单 复杂 复杂 培养基 简单 简单 复杂 复杂 成本 低 低 中 高 产率 高 中 中 低 表达量 高 高 较高 较低 蛋白折叠 中 较好 较好 好 胞外表达 周质空间 分泌至培养基 分泌至培养基 分泌至培养基 细胞增殖周期 30min 90min 18H 24H 折叠 常有错误折叠 偶有不当折叠 正确折叠 正确 二硫键 难以形成 有 有 有 N-糖基化 无 甘露糖残基,高 无唾液酸,简单 复杂 O-糖基化 无 有 有 有 磷酸化 无 有 有 有 酰化 无 有 有 有 γ-羧基化 无 无 无 有 适用 原核蛋白、简单真核蛋白 真核蛋白、分泌表达蛋白 真核蛋白、分泌表达蛋白 复杂高等真核生物蛋白 表 1:常用表达系统比较 2. 原核表达系统 原核表达系统发展完善、流程简单快速、成本低、产量高,对大部分蛋白来说都值得一试,尤其适宜于表达原核来源的以及不需要翻译后修饰的真核蛋白 表达菌株 原核表达系统刚用的宿主菌有E. coli,Bacillus等其中革兰式阳性的Bacillus更适宜在其周质空间分泌表达重组蛋白;革兰氏阴性的E. coli能够广谱表达异源蛋白。
大肠杆菌表达系统是目前发展最完善的重组蛋白表达系统常用大肠杆菌菌株有 BL21(DE3) 、BL21(DE3)Star、B834(DE3)等,这些菌株都敲除了蛋白酶,并溶源了噬菌体DE3DE3 是的一种衍生 λ 噬菌体,带有噬菌体 21 抗性区和 lacI基因,lacUV5 启动子,以及 T7 RNA 聚合酶基因这一区段被插入int基因,因此阻止了 DE3 在没有辅助噬菌体时整合到染色体上或从染色体切出一旦形成 DE3 溶原状态,就只有受 IPTG 诱导的lacUV5启动子指导 T7 RNA 聚合酶基因转录,在溶原培养体系中加入 IPTG 诱导 T7 RNA 聚合酶生产,继而质粒上的目的 DNA 开始转录 同时, 还有一些特殊设计的菌株以表达有特殊需要的重组蛋白,如甲硫氨酸营养缺陷型表达硒代甲硫氨酸蛋白,溶解性增强的菌株表达毒性蛋白,补充了稀有密码子的菌株表达真核蛋白等,表 2 给出了常用的大肠杆菌表达菌株 常用表达菌株 应用 抗生素抗性 B834 met 营养缺陷性, 对照株, 不能使用 T7 启动子,蛋白酶敲除 无 B834(DE3) met 营养缺陷性,蛋白酶敲除 无 BL21 对照株,不能使用 T7 启动子,蛋白酶敲除 无 BL21(DE3) 常规表达宿主菌,蛋白酶敲除 无 BL21(DE3) 高严紧表达宿主菌,蛋白酶敲除 氯霉素(34μg/ml) BL21trxB(DE3) 常规表达宿主菌,在胞质中形成二硫键,蛋白酶敲除 卡那霉素(15μg/ml) BL21trxB(DE3)pLysS 高严紧表达宿主菌,在胞质内形成二硫键,蛋白酶敲除 卡那霉素(15μg/ml)氯霉素(34μg/ml) Origami 对照株,不能使用 T7 启动子 四环素(μg/ml)卡那霉素(15μg/ml) Origami(DE3) 常规表达宿主菌,更好的在中形成二硫键 四环素(μg/ml)卡那霉素(15μg/ml) Origami(DE3)pLysS 高严紧表达宿主菌,更好的在中形成二硫键 四环素(μg/ml)卡那霉素(15μg/ml)氯霉素(34μg/ml) Rosetta 对照株,不能使用 T7 启动子,蛋白酶敲除 氯霉素(34μg/ml) Rosetta(DE3) 常规表达宿主菌,lac 透性酶突变, 可以控制表达水平,提供稀有密码子 tRNAs, 蛋白酶敲除 氯霉素(34μg/ml) Rosetta(DE3)pLysS 高严紧表达宿主菌,lac透性酶突变,可以控制表达水平,提供稀有密码子 tRNAs,蛋白酶敲除 氯霉素(34μg/ml) Rosetta-gami 对照株,不能使用 T7 启动子 四环素(μg/ml)卡那霉素(15μg/ml)氯霉素(34μg/ml) Rosetta-gami(DE3) 常规表达宿主菌,更好的在胞质内形成二硫键,提供稀有密码子tRNAs 四环素(μg/ml)卡那霉素(15μg/ml)氯霉素(34μg/ml) Rosetta-gami(DE3)pLysS 高严紧表达宿主菌,更好的在胞质内形成二硫键,提供稀有密码子 tRNAs 四环素(μg/ml)卡那霉素(15μg/ml)氯霉素(35μg/ml) 表 2:常用E. coli表达菌株 质粒载体: 大肠杆菌表达系统采用质粒为表达载体,质粒上的重要元件包括复制子,启动子,终止子,多克隆位点,信号肽,融合标签,筛选标记等(图 1) 。
原核表达载体已经发展得比较完善,有多种质粒可供选择(表 4) 复制子: 复制子决定着质粒载体在宿主中的拷贝数 通常情况下质粒拷贝数越高, 重组蛋白的表达量就越高,但是高拷贝的质粒也会严重影响宿主的生长,质粒本身也不稳定,容易丢失和突变克隆载体常采用拷贝数低、严谨复制的复制子,如 pSC101;表达载体通常选用高拷贝的复制子,如 pCoE1,pMBI(pUC) ,等如果需要进行多个质粒的共转化,就要根据复制子的相容性选用不同复制系统的复制子,如 pSC101 和 pUC 共表达 启动子: 表达重组蛋白时,我们需要考虑启动子的强弱、作用方式、调控方式和本底表达水平表达载体通常选用强启动子以提高表达量,但弱启动子也有其优点,如降低本底表达、增加可溶表达、表达小量伴侣蛋白等按照作用方式,启动子可以分为两类:组成型表达的启动子使宿主不停地表达重组蛋白,常用于工业生产,如σS等;诱导型表达的启动子使宿主仅在受到诱导 (诱导剂、 温度等) 时表达目的蛋白, 诱导型启动子使重组蛋白的表达容易控制,同时降低了外源蛋白对细菌生长的影响 图 1:大肠杆菌表达质粒 pET-22b(+)图谱及多克隆位点 早期大肠杆菌表达体系中,常见的启动子是lac和lacUV5。
lac是一个弱启动子,很难使外源基因得到高表达目前使用的含有需要小量共表达的蛋白(如分子伴侣,蛋白抑制剂等)的载体,有很多都采用了经典的lac启动子 强启动子中,tac和trc是lac启动子的变体,其重组蛋白产率能够达到细胞总蛋白量的 15-30%araBAD 启动子的诱导剂是便宜无毒的 L-阿拉伯糖,本底表达量低,启动能力比tac稍弱T7 则是目前原核表达系统中最高效的启动子,pET 表达系统即是以它为中心构建的T7 启动子来源于 λ 噬菌体,专一与 T7 启动子结合的 T7 RNA 聚合酶则被整合在宿主菌的基因组中在 λ 噬菌体溶源的表达宿主菌,如 BL21(DE3)中,lacI抑制 T7 RNA 聚合酶的表达,IPTG 的加入可以解除这种抑制当受到诱导时,T7 RNA 聚合酶开始表达并结合在T7 启动子上,启动重组蛋白的表达T7 RNA 聚合酶活性很高,转录速度比大肠杆菌 RNA 聚合酶快 5 倍, 使其下游的重组蛋白得到高效表达, 其产率可以达到细菌总蛋白量的 50%以上T7lac启动子则在 T7 启动子下游加入了一个lac操纵子,其中带有一个常规启动子和lac阻遏蛋白的编码序列。
lac阻遏蛋白可以抑制宿主合成 T7 RNA 聚合酶,并阻断 T7 RNA 聚合酶导致的目的基因转录,从而降低重组蛋白的本底表达水平 PL、cspA 启动子使宿主菌能够进行温度依赖型的表达在温度敏感型突变体菌株中,PL等启动子使得宿主在 30℃时抑制重组蛋白表达,而在 42 ℃时诱导重组蛋白表达;cspA 启动子则被高温(37℃)抑制,低温(10℃)启动温度诱导型的启动子避免了诱导剂的引入,降低了使用成本,同时也降低了诱导剂对细胞的伤害 终止子: 转录终止子按照是否依赖和不依赖 ρ 因子的作用分为两类,这两类终止子均在终止点前含有一段 7-20bp 的回文序列终止子可以保护 mRNA 在核外不被降解,显著延长 mRNA 的寿命,由此提高重组蛋白的表达量但是对于 T7 系统来说,由于 T7 RNA 聚合酶效率极高,宿主中随时都有充足的 mRNA 以供翻译, 因此大部分在 T7 系统中表达的重组蛋白并不在意质粒上是否有终止子,只有一些自身带有翻译起始信号的外源基因需要终止子 启动子受细胞类型的限制,在不同的细胞系中有很大不同,因此需根据宿主细胞(尤其是真核宿主)的类型选择不同的启动子以便于目的基因的高效表达。
融合标签: 融合标签是与目的蛋白共表达的一段多肽,方便重组蛋白的纯化、固定和检测,表 3给出了常用的重组标签如果不需要对重组蛋白进行纯化,尽量不要引入融合标签,以免影响蛋白性质;如果重组蛋白本身能够结合某种亲和柱,如某些金属结合蛋白可以结合Ni-NTA ,某些糖结合蛋白能够特异识别糖类,也不必引入标签 融合标签的引入能够大大简化重组蛋白的纯化流程, 并提高蛋白溶解度 商业化表达质粒,如 pET、pGEX 等提供了各种纯化标签和融合蛋白供选,应根据蛋白具体情况进行选择 His-tag 是最常用的纯化标签,它具有很多优点:标签较短(10-20 个氨基酸残基) ,不带电() ,免疫原性差,通常不影响重组蛋白的结构和功能,Ni2+亲和力高,能够通过一步纯化达到 60%-90%的纯度 如果蛋白质溶解度不高,导致折叠困难、表达量低,可以选择较大的融合标签(GST、MBP、Trx 等)帮助重组蛋白表达和折叠,提高重组蛋白溶解度,从而提高表达量较大的融合标签有时也会导致翻译困难甚至提前中止, 纯化后发现大部分都是标签蛋白也是常见现象 翻译的提前中止会大大影响重组蛋白产率和后续纯化, 所以在短标签能够达到目的的时候,尽量不要选择大的融合标签。
标签位置的选择也很重要:N 端标签(短的或长的)自身带有启动子和适应宿主偏好的密码子,可以帮助目的蛋白表达,提高表达量,但是提前中止翻译的蛋白片段也会被一并纯化出来,降低重组蛋白纯度,对蛋白酶敏感的、自身容易降解的以及一级序列中有集中的疏水残基区的蛋白尤其要避免使用 N 端标签;C 端标签则可以保证只有完整蛋白得到纯化另外,如果蛋白的近 N 端或近 C 端有重要功能区,如酶活中心、配体结合位点、二硫键、多聚体稳定界面、相互作用界面等,则要避免纯化标签位于该末端,以免影响重组蛋白的结构和功能 如果融合标签对蛋白性质有较大影响, 但又是纯化所必须的, 就可以考虑在纯化过程中去除标签主要有三种方法:化学裂解,如溴化氰(CNBr) 、羟胺(NH2OH)等,能够简单有效地去除标签,但反应条件苛刻(羟胺需要在下反应) ,特异性较差,而且会引入不必要的修饰,除包含体蛋白的处理外已经很少使用了;酶解,如 PPase 等,其底物一般是一段比较长的肽链,特异性强,是目前比较常用的方法,缺点是酶切反应需要较长的时间,也增加了蛋白纯化的步骤,使纯化变得繁琐;IMPACT 质粒,该质粒在纯化标签和目的蛋白之间插入了一个蛋白质内含子(intein) ,intein 具有可诱导的自切割活性,使用 IMPACT 质粒表达的重组蛋白,只需要改变缓冲液的 pH 和温度,即可切掉融合标签。
标签 N/C 端或内部(I) 大小 (氨基酸残基) 鉴定/纯化原理 T7-Tag N,I 11 单克隆抗体 S-Tag N,I 15 S-蛋白亲和 His-Tag N,C,I 6 金属螯合层析 HSV-Tag C 11 单克隆抗体 pelBlampT N 20 细胞周质定位 KSI N 125 疏水区 Trx-Tag N 109 提高细胞质可溶性,单克隆抗体 PKA site I 5 蛋白激酶 A 识别位点 CBDclos-Tag N 156 纤维素结合 CBDcenA-Tag N 114 纤维素结合,细胞周至/培养基定位 CBDcex-Tag C 107 纤维素结合,细胞周至/培养基定位 DsbA-Tag N 208 细胞周质定位 DsbC-Tag N 236 细胞周质定位 GST-Tag N 220 提高细胞质可溶性,谷胱甘肽亲和 MBP-Tag N,I 370 提高细胞质可溶性,麦芽糖亲和 Nus-Tag N,I 495 提高细胞质可溶性,单克隆抗体 表 3:常用融合标签 筛选标记: 在没有压力的环境下培养时, 细菌中的外源质粒常常随着细胞复制而丢失 为了稳定质粒、 表达重组蛋白, 需要在载体中加入筛选标记, 使宿主菌在原则压力下生长。
原核系统中,常见的筛选标记有蓝白斑筛选(主要用于克隆) 、营养缺陷性筛选和抗生素筛选,也可以将几种筛选手段混合起来使用 常见的抗生素筛选标记有:青霉素抗性、卡那霉素抗性、氯霉素抗性、四环素抗性等氨苄青霉素由于会被抗性细菌分泌的 β-内酰胺酶和酸性环境破坏掉,其筛选效果会随时间降低,不适宜连续发酵,将抗性基因反转或换用对低 pH 不敏感的羧苄青霉素可以部分解决这个问题;卡那霉素不会被破坏,抗性较强,但是不同菌株的抗性差异较大,平板培养和悬浮培养液有所不同, 使用时常需要针对个别菌株摸索适宜浓度; 氯霉素抗性常见于有特殊用途的菌株和质粒,如 pLysS 抗生素浓度的过高或过低都会降低重组蛋白的表达量, 另外在使用多个载体进行共表达时,应注意不同的质粒要携带不同的筛选标记,抗生素浓度也要比单独表达适当降低 分泌表达: 如果不希望重组蛋白表达在细胞质中, 可以在重组蛋白的 N 端加入信号肽, 引导蛋白穿越细胞膜 大肠杆菌的分泌表达一般是分泌到周质空间, 各种芽孢杆菌则可以分泌到培养基中,简化纯化流程分泌表达的表达量通常远远低于胞质表达,但是也有其优势:跨膜过程可以帮助重组蛋白折叠, 提高其溶解性和活性; 周至空间和培养基的氧化环境能够帮助二硫键形成; 也可用于除去牢固结合在蛋白上的配体; 分泌到细胞外还能降低有毒重组蛋白对细胞的影响。
载体 启动子 抗生素抗性 融合标签 1 蛋白酶 信号肽 pET: Novagen pET-3a-d T7 ampR T7 pET-11a-d T7lac ampR T7 pET-15b T7lac ampR His 凝血酶 pET-17b T7 ampR T7 pET-19b T7lac ampR His 肠激酶 pET-20b T7 ampR His 有 pET-21a-d T7lac ampR His,T7 pET-22b T7lac ampR His 有 pET-23a-d T7 ampR His,T7 pET-24a-d T7lac kanaR His,T7 pET-28a T7lac kanaR His,T7 凝血酶 pET-30a-c T7lac kanaR His,S 凝血酶,肠激酶 pET-31b T7lac ampR His 凝血酶,肠激酶 pET-32a-c T7lac ampR His,S,Trx 凝血酶,肠激酶 pET-35b T7lac kanaR His,S,CBD 凝血酶,Xa 因子 pET-37b T7lac kanaR His,S,CBD 凝血酶,Xa 因子 有 pET-39b T7lac kanaR His,S,Dsb 凝血酶,肠激酶 pET-41a-c T7lac kanaR His,S,GST 凝血酶,肠激酶 T7lac ampR His,S,HSV,Nus 凝血酶,肠激酶 pGEX: GE pGEX-1λT tac ampR GST 凝血酶 pGEX-2TK tac ampR GST 凝血酶,肠激酶 pGEX-3X tac ampR GST Xa 因子 pGEX-4T-1 tac ampR GST 凝血酶 pGEX-5X-1 tac ampR GST Xa 因子 pGEX-6P-2 tac ampR GST Ppase pMAL: NEB pMAL-c2X/E/G tac ampR MBP Xa因 子 / 肠 激 酶/Genease pMAL-p2X/E/G tac ampR MBP Xa因 子 / 肠 激 酶/Genease 有 表 4:常用原核表达载体质粒 优化表达条件 重组蛋白的表达流程很少有一次成形的,为了提高蛋白表达量、改善蛋白质量,表达条件和流程的优化是必须的。
当重组蛋白不表达时: 如果重组蛋白不表达(包含体和可溶蛋白都没有) ,首先检查 cDNA 和质粒是否正确,蛋白对宿主菌是否有很大毒性,然后尝试更换菌株、质粒载体和融合标签原核蛋白在大肠杆菌中不能表达的情况很少见,通常是真核蛋白不能表达不能表达的重组蛋白,即使在更换了宿主、载体后可以表达,表达量也不会很高,如果需要大规模生产,最好尝试酵母和昆虫细胞表达系统 当表达量不理想时: 检查密码子构成,使其适应宿主菌的密码子偏好稀有密码子,尤其是位于重组蛋白 N端的和大量集中的稀有密码子,会降低 mRNA 稳定性,显著降低翻译速度,引起翻译提前中止、翻译移码和突变将这些稀有密码子(尤其是 N 端! )突变为宿主偏好的密码子,能够显著提高表达水平,必要时可以根据宿主的偏好重新合成 cDNA另一个解决办法是与能够表达稀有 tRNA 的质粒共表达或直接采用带有该质粒的宿主菌, 如 BL21 codon plus、 Rosetta等更换菌株容易引起一系列问题,如启动子相溶性、额外的抗生素抗性等,使用时要多加注意 检查外源基因 cDNA5’端结构,高 GC 含量、回文结构和相距较近的两个起始密码子会阻碍转录起始,表达量不理想时应予以去除; 检查终止密码,mRNA 的通读会降低重组蛋白的质量和稳定性。
不同终止密码子的终止效率在不同的物种中有很大差异,酵母和哺乳动物偏爱 UAA 和 UGA,昆虫和大肠杆菌倾向于用 UAA; 终止密码子 3’端紧邻的碱基也会影响终止效率, 对于 UAG 来说, 终止效率 U、 A>C>G,其他终止密码 G>U、A>C;也可以多加一个终止密码子,以确保翻译在正确的位点结束 改变融合标签的位置,N 端的标签可以帮助翻译起始,从而提高蛋白的表达量 可溶表达低时: 错误折叠是引起重组蛋白可溶表达量低, 包含体表达量高的一个重要原因 改善重组蛋白折叠的方法有: 降低诱导后培养温度重组蛋白表达得越慢,其折叠效果就越好,大肠杆菌在 4℃时依然可以表达重组蛋白,而将培养温度降低至 25-30℃就能显著改善蛋白折叠此方法不适用于温度诱导的重组蛋白表达; 减少诱导剂诱导剂浓度可以降低至 1/10;选用 Lac 渗透酶缺陷型菌株,如 Tuner、Rosetta 等,也有很好的效果这类菌株能够使进入每个细胞的诱导剂浓度相同重组蛋白在所有细胞中的表达水平相当时,减少诱导剂的效果更好; 增加一个融合标签,或者更换一个分子量更大的标签一般来说,越大的融合标签在提高重组蛋白溶解度方面效果越好,如 MBP、GST 的效果要优于 His6标签。
以改善溶解度为目的的融合标签最好放置在目的蛋白的 N 端; 改善二硫键的形成 大肠杆菌细胞内的还原环境会阻碍二硫键的形成, 如果要表达有一对或多对二硫键、 特别是需要二硫键来稳定分子内和分子间结构的重组蛋白, 最好选用经过特别设计的载体和菌株, 如 pET39b(+)和 pET40b 质粒、 BL21trxB, Origami 和 Rosetta-gami菌株 也可以考虑将蛋白分泌至周至空间, 利用周至空间的氧化环境和酶来帮助二硫键的形成; 只表达蛋白的可溶片段可溶片段突变体与全蛋白之间经常有很大差异,如等电点、抗原性、寡聚状态、活性、细胞定位等,突变时一定要谨慎考虑; 突变掉可能引起顺反异构的 Pro顺反异构伴随着很高的能量跃迁,是蛋白折叠的能量壁垒突变掉这样的 Pro 可以显著帮助重组蛋白折叠,但是同样会改变蛋白性质,要谨慎考虑; 与分子伴侣和折叠酶共表达 微量的分子伴侣即可显著改善重组蛋白的折叠状况, 与重组蛋白同源的分子伴侣效果更加明显 引入分子伴侣同样也会引起复制子相容性、 额外的抗生素抗性等问题,常用的分子伴侣有 ATP 依赖的 DnaK-DnaJ-GrpE 和 GroEL-GroES,以及定位于周质空间的分子伴侣 SurA、PpiD 等。
折叠酶可以帮助蛋白跨过折叠过程的能量壁垒,使重组蛋白更快更好的折叠; 在重组蛋白 N 端加入信号肽, 将其引导至周质空间, 用跨膜过程来帮助蛋白折叠和二硫键形成,并减轻蛋白降解; 在培养基中加入重组蛋白的配体或底物类似物 配体结合, 有时仅仅是配体的存在就能大幅度的改善蛋白的折叠和稳定性,此法不适用于无法被细菌摄取的配体; 如果是多个蛋白共表达,可以考虑用一段柔软的 linker 将两个蛋白连接起来,使溶解度好的蛋白帮助溶解度差的蛋白折叠; 改善蛋白稳定性能够引起蛋白降解的因素很多,从蛋白自身性质到宿主性质不一而足,如果重组蛋白在表达时就被降解,表达量和稳定性就会受到很大影响在大肠杆菌中表达重组蛋白,需要牢记 N 端法则:当 N 端第二个残基是 Leu、Arg、Lys、Phe、Tyr 和 Trp时,重组蛋白半衰期只有 2 分钟,而小侧链的氨基酸残基,如 Ala,则可以提高蛋白稳定性因此在设计载体时,要特别注意第二个密码子,避免上述残基的出现 处理高毒性蛋白: 外源基因的表达对大肠杆菌总有或多或少的影响,一般来说,经过改造的宿主可以在很大程度上容忍重组蛋白,重组蛋白可以占到细胞总蛋白量的 50%或更高。
但少数毒性极高的重组蛋白,其本底表达就会杀死原核宿主,质粒容易丢失,使其在大肠杆菌中很难得到高表达以下方法可以降低重组蛋白的本底表达量 在培养基中加入 1%的葡萄糖葡萄糖是大肠杆菌的第一碳源,它的存在可以显著降低由其他碳源引起的本底表达 采用严格启动的载体和宿主如 PBAD 载体、pLacI 宿主 采用低拷贝数的载体降低表达载体质粒的拷贝数,可以明显降低基础表达水平如pETcoco 载体在每个细胞中仅一个拷贝,而受到 IPTG 诱导时又可以高效表达重组蛋白 采用可表达 T7 溶菌酶的宿主T7 溶菌酶是 T7RNA 聚合酶的抑制剂,采用含有 T7 溶菌酶质粒的宿主,如 pLysS,可以降低重组蛋白在大肠杆菌快速生长期的本底表达量,在受到IPTG 诱导时也能较好的表达蛋白 除此之外,也可以通过共表达重组蛋白的抑制剂、提高抗生素浓度等方法提高毒性蛋白的表达量 包涵体表达: 在使用高效的E. coli表达系统时,过量表达的重组蛋白常会在细胞内凝聚,形成无活性的包涵体沉淀在早期实验中,包涵体被认为是重组蛋白表达的大敌:包涵体蛋白折叠混乱、二硫键配对混乱、没有生物活性、变复性条件需要长时间摸索等,即使包涵体蛋白成功复性,其均一性和活性依然备受质疑。
但是包涵体表达也有其优势:能够很轻松的获得超高的表达量,不可溶的重组蛋白不会被宿主内的蛋白酶降解,重组蛋白的毒性被大大抑制,杂蛋白含量低(~10%) ,容易纯化等由于这些优点以及蛋白质复性条件的不断发展,表达包涵体蛋白逐渐为人们所接受,成为重组蛋白表达的一个常用方案 与可溶蛋白相反,提高培养温度、延长培养时间、在较高的菌密度下诱导都有利于包涵体的形成; 在破菌和变性溶解时加入还原剂能够打开错配的二硫键; 在复性液中加入二硫键异构酶、脯氨酸异构酶、分子伴侣和蛋白的辅助因子可以帮助重组蛋白折叠;精氨酸和高分子量 PEG 能减轻蛋白分子的聚集;尝试多种物理手段,如透析、快速稀释和柱上复性等,有时对复性有奇效包涵体的表达相对简单,但其复性过程仍是依赖经验的,没有通用的方法可以套用 3. 酵母表达系统 酵母表达系统兼有原核和高等真核系统的优点 酵母是一种单细胞低等真核生物, 培养条件普通,生长繁殖速度迅速,能够耐受较高的流体静压,用于表达基因工程产品时,可以大规模生产,有效降低了生产成本酵母表达外源基因具有一定的翻译后加工能力,收获的外源蛋白质具有一定程度上的折叠加工和糖基化修饰,性质较原核表达的蛋白质更加稳定,特别适合于表达真核生物基因和制备有功能的表达蛋白质。
某些酵母表达系统具有外分泌信号序列,能够将所表达的外源蛋白质分泌到细胞外,因此很容易纯化 应用酵母表达系统生产外源基因的蛋白质产物时也有不足之处,如产物蛋白质的不均一、信号肽加工不完全、内部降解、多聚体形成等,造成表达蛋白质在结构上的不一致另外, 还时常遇到表达产物的过度糖基化情况 因此, 表达系统应根据具体情况作适当的改进 常用酵母表达系统(宿主-载体系统) 酿酒酵母(Saccharomyces cerevisiae)表达系统 由于遗传和生理背景清楚而且安全,酿酒酵母是最早应用于重组蛋白表达的酵母宿主菌 表达菌株: INVSC1 是酿酒酵母表达系统的常用菌株,它是一种双倍体营养缺陷细胞株,在缺少组氨酸、亮氨酸、色氨酸和尿嘧啶的培养基中(如 SC 基本培养基)不能生长GAL1 是酿酒酵母表达系统中常用的启动子,以半乳糖作为碳源可以诱导转录起始,葡萄糖则抑制转录在葡萄糖培养基中, 重组蛋白只有本底水平的表达, 收集菌体并转入只含半乳糖的培养基可以诱导重组蛋白表达也可以使用棉子糖代替葡萄糖作为碳源,棉子糖对 GAL1 启动子没有影响, 既不会抑制也不会激活, 在菌体达到一定浓度之后直接加入半乳糖即可诱导重组蛋白表达。
酿酒酵母可以对重组蛋白进行乙酰化修饰,以及没有位点特异性的 Ser/Thr 磷酸化修饰,还可以进行 Asn N-糖基化和 Ser/Thr O-糖基化修饰酿酒酵母的糖基化修饰采用单一的甘露糖残基,N-糖基化修饰由 1,3-和 1,6-甘露糖残基构成,往往形成 40-200 个甘露糖残基的较大糖链,通过基因改造可以阻断 N-糖基化过程,使糖链缩短为 Man8GlcNAc2核心糖链,糖链末端为 1,3-甘露糖,使重组蛋白的抗原性明显增强O-糖基化则由不超过 5 个的甘露糖残基聚合而成 表达质粒 真核表达系统常采用穿梭质粒为表达载体 穿梭质粒含有两套复制子和启动子, 以及相应的筛选标记, 可以在原核和真核两种宿主中分别完成复制和表达, 以方便对质粒进行遗传操作和大量制备 酿酒酵母本身含有质粒, 其表达载体可以有自主复制型和整合型两种 自主复制型质粒中,高拷贝载体通常采用酵母天然质粒的复制子,如 2μ 复制子,以使载体在宿主中达到较高的拷贝数(10-40) ,并独立于宿主染色体进行复制;低拷贝复制子则采用从酵母染色体中的自主复制序列(ARS)作为复制子,在宿主中严紧复制,通常一个细胞只有 1-2 个拷贝。
真核表达载体常用的筛选标记有营养缺陷型(如 URA3、TRP1)和抗生素抗性(如灭瘟素、G418 等) 载体 启动子 筛选标记 融合标签 pYES2 μ2 URA3 无 pYES2/NT μ2 URA3 Xpress pYES2CT μ2 URA3 V5, His pYES3/CT μ2 TRP1 V5, His pYES6/CT μ2 灭瘟素 V5, His pYC2/NT CNE6/ARSH4 URA3 Xpress pYC2/CT CNE6/ARSH4 URA3 V5, His pYC6/CT CNE6/ARSH4 灭瘟素 V5, His 表 5:常用酿酒酵母表达载体 整合型质粒(如 Yip5)不含 ARS,必需整合到染色体上,随染色体复制而复制整合过程是高特异性的,但是拷贝数一般很低多拷贝整合载体 pMIRY2 通过将目的基因靶向整合到 rDNA 簇上(rDNA 簇为酵母基因组中串联存在的 150 个重复序列)克服了这个缺点,利用pMIRY2 质粒可以得到 100 个以上的拷贝 酿酒酵母作为表达菌株具有一定的局限性, 如缺乏强有力的启动子, 重组蛋白产率往往只有全细胞蛋白的 5%左右;难于高密度培养;分泌效率低,几乎不分泌分子量大于 30 kD的外源蛋白,有时蛋白只被分泌到周至空间而非培养基中;重组蛋白容易过度糖基化;内部降解复杂,重组蛋白的 C 端往往被截短。
因此,现在一般使用甲醇酵母代替酿酒酵母,用于重组蛋白质的真核表达 毕赤酵母(P. Pastoris)表达系统 毕赤酵母是一种甲醇营养型酵母, 可以依赖甲醇作为唯一碳源生长, 甲醇可以诱导代谢所需的酶的表达目前发现的所有甲醇营养型酵母,其甲醇代谢途径都是相同的,甲醇首先被乙醇氧化酶(AOX)氧化,生成甲醛和过氧化氢为了避免过氧化氢毒害细胞,这步反应在过氧化物酶体中进行在毕赤酵母中,AOX 有两个编码基因:AOX1 和 AOX2,其中 AOX1 基因编码了细胞内绝大多数的乙醇氧化酶AOX1 的表达受 AOX 启动子的严格调控,本底表达水平极低,而甲醇诱导表达量可以达到细胞总蛋白的 30%以上,使用 AOX 启动子使得重组蛋白可以达到很高的表达量 毕赤酵母中,His+转化子可以自发的进行高拷贝整合,概率为 1-10%,选择带有 HIS4基因的表达载体即可以提高外源基因的拷贝数,从而提高重组蛋白的表达水平 毕赤酵母也是重组蛋白分泌表达的理想宿主毕赤酵母本身只分泌表达少量蛋白,而且可以使用不含蛋白的培养基, 因此分泌表达的重组蛋白在培养基中占据了绝对优势, 大大简化了纯化步骤 表达菌株: 毕赤酵母的表达菌株都是由野生型石油酵母 NRRL-Y11430 改造而来,含有一种或几种营养缺陷(如his4、arg4等)以方便筛选(表 6) 。
研究发现,敲除了 AOX 基因的菌株有时能更好的表达外源蛋白, 而且诱导所需的甲醇量也大大降低了 按照 AOX 基因的敲除情况和利用甲醇的能力,毕赤酵母表达菌株可以分为 3 类:在甲醇培养基中快速生长的 Mut+;敲除了 AOX1,在甲醇培养基中慢速生长的 MutS和敲除了两个 AOX 基因,不能利用甲醇的 Mut-不同的表型可以用来检测外源基因在毕赤酵母转化子中的整合方式 除此之外, 还有敲除了蛋白酶(prb1、pep4)的菌株,以保护重组蛋白不受宿主蛋白酶的攻击蛋白酶缺陷型的菌株生长比较缓慢 与酿酒酵母相同,毕赤酵母也可以进行二硫键形成、磷酸化、乙酰化、糖基化等翻译后修饰,也只能利用甘露糖残基对蛋白进行糖基化修饰毕赤酵母的 N-糖基化糖链较短,平均每个支链 8-14 个甘露糖残基,有利于重组蛋白的分子均一性;而且糖链中和糖链末端都没有 1,3-甘露糖,对重组蛋白抗原性的影响也比酿酒酵母低 毕赤酵母表达菌株 甲醇利用表型 营养缺陷 蛋白酶敲除 X-33 Mut+ - - GS115 Mut+ 组氨酸缺陷 - KM71 MutS 组氨酸、精氨酸缺陷 - KM71H MutS 精氨酸缺陷 - MCIO0-3 Mut- 组氨酸、精氨酸缺陷 - SMD1163 Mut+ 组氨酸缺陷 PEP、PRB 敲除 SMD1165 Mut+ 组氨酸缺陷 PRB 敲除 SMD1168 Mut+ 组氨酸缺陷 PEP 敲除 SMD1168H Mut+ - PEP 敲除 表 6:常用毕赤酵母表达菌株 表达载体: 毕赤酵母本身没有质粒,自主复制型载体通常不稳定,因此一般采用整合型载体。
整合型载体的外源基因表达盒由几部分组成:AOX 启动子、多克隆位点、融合标签、AOX 终止子, 有时还有一段 AOX1 基因的 3’端非编码区, 以便将外源基因表达盒导入基因组中的 AOX1位点一些载体还含有外分泌信号肽,使重组蛋白分泌至培养基中某些载体允许构建多个串联的外源基因表达盒, 以弥补整合型载体拷贝数量的缺陷 组成型表达的 GAP 启动子可以替代 AOX 启动子:GAP 启动子不需要甲醇诱导,表达水平较高,操作简单,但不能表达对宿主有高毒性的蛋白 除表达盒之外,载体上还有筛选标记(营养缺陷互补基因、抗生素抗性基因)和在细菌中进行拷贝增殖所必须的序列(启动子、终止子、复制子、抗生素抗性基因等) 遗传霉素 G418 抗性和博来霉素 Zeocin 抗性是常用的抗生素筛选标记, 常用于外源基因多拷贝的筛选博来霉素抗性由于基因很小(375bp) ,易于操作,而且也能对原核宿主进行筛选,逐渐成为人们偏爱的筛选标记 载体质粒需要首先进行线性化,才能重组到宿主染色体中克隆载体上一般有多个线性化酶切位点供选 基因重组可以发生在基因组中AOX基因区域和相应的质粒AOX区域之间,包括 AOX 启动子、终止子和 3’非编码区。
通过选择不同的线性化位点控制重组和外源基因的插入,可以导致宿主的不同甲醇利用表型(Mut+/Muts) 如选择 AOX 启动子和 3’端非编码区的酶切位点,会导致染色体中的 AOX 基因被置换下来,使 Mut+表型的宿主变为 Muts如果需要多拷贝的外源基因, 可以使用带有 HIS4 基因的载体, 并选择 HIS4 中的酶切位点进行线性化 这个线性化位点不会影响宿主的甲醇利用表型, 最终得到的表达菌株表型与宿主相同 图 2:酵母表达载体 pPIC9K 质粒图谱 常用毕赤酵母表达载体 启动子 拷贝数 分泌信号肽 筛选标记 融合标签 AOX1 低 - HIS4 - AOX1 高 - HIS4, 遗传霉素 - pPIC9 AOX1 低 α 因子 HIS4 - pPIC9k AOX1 高 α 因子 HIS4, 遗传霉素 - pAO815 AOX1 高 - HIS4 - pHIL-S1 AOX1 低 PHO1 HIS4 - pHIL-D2 AOX1 低 - HIS4 - pPIC6A,B,C AOX1 低 - 灭瘟素 c-myc 抗原,His pPIC6αA,B,C AOX1 低 α 因子 灭瘟素 c-myc 抗原,His pPICZαA,B,C AOX1 低 α 因子 博来霉素 c-myc 抗原,His pPICZA,B,C AOX1 低 - 博来霉素 c-myc 抗原,His pGAPZαA,B,C GAP 低 α 因子 博来霉素 c-myc 抗原,His pGAPZA,B,C GAP 低 - 博来霉素 c-myc 抗原,His 表 7:常用毕赤酵母表达载体 表达条件的优化: 检查外源基因的一级序列:5’端不能有回文结构;密码子构成需要适应宿主的密码子偏好,特别是 N 端前几个,如使用了酵母厌恶的密码子会大大影响表达量;高 AT 含量的序列会使转录提前中止;检查重组蛋白序列,分泌表达时需要糖基化位点 Asn-X-Ser/Thr。
宿主表型:尝试 Mut+/MutS/Mut-表型的宿主,不同的基因在不同的宿主菌中可能表达量截然不同,多试几种菌株,挑选最优的表达体系胞内表达尽量使用 MutS和 Mut-的宿主菌,以降低乙醇氧化酶的表达,提高重组蛋白产率 多拷贝转化子的筛选:在使用、pPIC9 等多拷贝载体时,需要对转化子进行大量的筛选工作以抗生素为筛选标记时,由于酵母的耐受能力与细胞密度有关,可能会出现假阳性,对挑选出来的高抗性转化子,还应做进一步的 PCR 验证,也可以省略平板筛选,直接做 PCR鉴定高克隆并不能一定带来高表达,表达菌株的最终确定应以表达量为准在表达分子量不大的蛋白时可以考虑换用 pAO815 载体,pAO815 可以精确控制外源基因拷贝数,一次转化即可获得含有正确数目插入的转化子,从而省去了转化子的筛选工作,其缺点是克隆复杂,载体较大 细胞定位:不是所有蛋白都适合分泌表达,如果重组蛋白本身定位于胞质中而且没有糖基化位点,应该尝试胞内表达 培养基: 重组蛋白分泌表达时, 最好选用 pH 可在较宽范围内变化的磷酸缓冲液培养基,优化培养基 pH 值能提高蛋白表达量和稳定性基本培养基可以简化纯化过程,丰富培养基则使表达菌株的生长更好,还有助于稳定重组蛋白,表达量偏低时最好使用丰富培养基。
培养基中的甘油浓度有时也会影响重组蛋白的表达量和活性, 甘油浓度过高会影响培养基溶氧量,需注意 甲醇浓度:不同的宿主-载体-重组蛋白体系的最优甲醇诱导浓度是不同的,从%-5%都有可能,是需要优化的一个重要表达条件摇瓶培养时甲醇浓度不易监测,需要根据经验补加;发酵培养则可以实现甲醇浓度的精确控制,有利于重组蛋白的高表达 细胞密度:提高细胞密度能够显著提高重组蛋白的表达量在培养基中添加不会抑制AOX 启动子的碳源,如山梨糖醇、甘露糖、海藻糖、丙氨酸等,可以提高生物量摇瓶培养效果不佳时,可以考虑发酵培养 蛋白酶:酵母细胞中有多种蛋白酶,也会分泌一些中性蛋白酶至培养基中如果重组蛋白对这些酶敏感,可以通过几种方法减轻蛋白酶的影响:降低培养基 pH 值,使蛋白酶失活;提高培养基中的蛋白含量,加入 1%酪蛋白水解物,用杂蛋白保护重组蛋白;换用蛋白酶敲除的宿主菌 溶氧量:越高越好毕赤酵母的生长对氧气要求不高,高效表达则需要大量氧气使用摇瓶表达时, 减少培养基体积并提高转速可以显著提高菌液溶氧量, 如果培养基中加有抗生素,甚至可以去掉棉塞,只用 4-8 层纱布封口 温度:培养温度超过 30℃将使酵母的生长和表达趋于停滞,如果摇床或发酵罐温度不稳,设置在 28℃。
过糖基化:重组蛋白的过糖基化不仅影响均一性,而且有时还会影响表达量尝试胞内表达、敲除 N-糖基化位点可以降低重组蛋白的糖基化水平,也可以在纯化时加入酶切除过长的糖链以提高蛋白均一性 菌株老化:表达菌株多次传代后表达量会明显降低,有时表达第一次、第二次产量都很高, 然后突然下降 长期表达时应注意保持菌株的新鲜: 用原始菌株多做一些甘油菌, -80℃冻存,每次表达之前都取出一管重新划线 重组蛋白不分泌或分泌量低:在分泌之前,重组蛋白必须正确折叠并形成正确的二硫键,错误和不当折叠都会干扰分泌通路共表达辅助因子,如分子伴侣(Hsp70、90 家族) 、二硫键异构酶 Pdi,过表达未折叠蛋白相应转录因子 Hac1p(诱导分子伴侣和分泌通路酶的表达)等方法可以帮助重组蛋白进入分泌通路,提高分泌表达量和蛋白活性 4. 昆虫细胞表达系统 昆虫细胞表达体统适宜表达高等真核生物蛋白昆虫细胞在培养中可以达到较高的细胞密度,具有复杂的翻译后修饰,如蛋白质的正确折叠与切割、二硫键形成、糖基化、磷酸化、酰化、酰胺化、羧甲基化等,很多修饰过程与哺乳动物都是相同的与酵母相同,昆虫细胞也可以进行胞内和分泌表达,启动子很强,重组蛋白表达量高,而且更适宜表达多元蛋白复合物。
昆虫细胞表达外源重组蛋白可利用质粒转染和病毒载体的感染利用质粒转染可以获得稳定的转染细胞,但实验周期较长,需几周甚至几个月时间,适宜连续发酵培养;利用病毒表达系统则可快速感染细胞, 在几天内使外源基因整合到病毒载体中, 适用于目的蛋白的表达检测 昆虫细胞表达系统 目前常用的昆虫细胞表达系统有杆状病毒-昆虫系统、 InsectSelect 稳定表达系统和果蝇表达系统三种 杆状病毒-昆虫(Baculovirus Expression Vector System, BEVS)表达系统: 杆状病毒(baculovirus)是一类以昆虫细胞为天然宿主的核型多角体病毒,其基因组为 80-160kb 大小的单一闭合双链超螺旋 DNA,约编码 154 个基因目前研究较多的是苜蓿银纹夜蛾核多角体病毒 (AcNPV)AcNPV 基因组具有较大的柔韧性,可以容忍较大片断的外源基因和多个外源基因的插入,病毒感染后期,宿主细胞会被裂解,因此 BEVS 不适于连续培养 AcNPV 能够感染大约 30 种鳞翅类昆虫细胞,在一定条件下也可以感染果蝇细胞,其中草地贪夜蛾 (Spodoptera frugiperda, Sf)卵巢细胞和粉纹夜蛾(Trichoplusia ni)胚胎细胞被发展成最常用的表达宿主。
杆状病毒常用的表达宿主有来源于草地贪夜蛾的 Sf9、Sf21 和来源于粉纹夜蛾的 High-Five、Tn-368,这些细胞质生长较快,能够达到较高的细胞密度,适应悬浮培养,可以使用无血清培养基,是重组蛋白表达的理想宿主由于昆虫细胞的 N-糖基化与哺乳动物细胞有较大差异, 人们设计了能够持续表达多种糖基转移酶的 Mimic Sf9 细胞,用以表达更高等生物的蛋白 AcNPV 的基因表达分为立早期表达、早期表达、晚期表达、极晚期表达 4 个阶段前两个阶段的基因表达早于DNA复制, 而后两个阶段的基因表达则伴随着一系列的病毒DNA合成其中在极晚期基因表达过程中,有两种高效表达的蛋白:多角体蛋白和 P10 蛋白多角体蛋白是形成包含体的主要成分,感染后期在细胞中的积累可高达 30%~50%,是病毒复制非必需成分,但对病毒粒子却有保护作用,可使之保持稳定和感染能力;P10 蛋白也是病毒复制非必需成分,可在细胞中形成纤维状物质,可能与细胞溶解有关多角体基因和 P10 基因的启动子具有较强的启动能力, 因此这两个基因位点成为杆状病毒表达载体系统理想的外源基因插入位点如将外源基因取代多角体蛋白基因构成重组病毒,病毒体内不含有包含体。
不形成包含体的病毒和形成包含体的病毒在平板中形成的空斑不同,利用这一特征筛选含有外源基因的重组病毒 使用 BEVS 系统需要将外源基因整合入杆状病毒基因组中解决这个问题主要有两种思路:Bac-to-Bac 系统改造了 AcNPV 基因组,将之构建成为一个超大的穿梭质粒(130k) ,使其能够在大肠杆菌中复制(单拷贝) ,再将带有外源基因的供体质粒转入带有病毒质粒的大肠杆菌中,使它们在原核宿主体内完成重组过程,将表达盒插入多角蛋白启动子下游,纯化后感染昆虫细胞收集重组病毒;In-Fusion 系统将野生型杆状病毒线性化,与带有外源基因和同源重组序列的载体直接共转染宿主细胞, 只有正确重组的病毒才能进行自我复制并裂解宿主,以此来制备重组病毒不论使用哪种方法,都需要在收集到大量重组病毒后再感染新鲜宿主,以获得高质量的重组蛋白 稳定表达系统 InsectSelect 系统和果蝇表达系统都是使用整合型质粒载体的重组蛋白表达系统整合型载体可以实现重组蛋白的连续发酵, 外源基因随机整合入染色体, 表达受插入位点的影响, 同时还可能会改变宿主细胞的生长特性, 因此需要做大量的筛选工作才能获得稳定的表达菌株。
InsectSelect(IS)系统: IS 系统可以进行重组蛋白的昆虫细胞连续分泌培养 此系统使用的载体为 pMIB/V5-His A,B,C 质粒,包括 OpIE2、OpIE1 启动子、蜜蜂蜂毒分泌信号肽(HBM) 、灭瘟素抗性基因、C 端 V5 抗原和 His 标签,以及在大肠杆菌中复制所必须的组分 OpIE2、OpIE1 启动子来源于杆状病毒OpMNPV,该病毒的天然宿主为冷杉合毒蛾Orgyia pseudotsugata,常用的表达宿主有 Sf9、Sf21、High Five、Kc1(果蝇) 、S2(果蝇) OpIE2启动子比 OpIE1 强 5-10 倍, 用于外源基因的表达, 后者则用于灭瘟素抗性基因的表达 OpIE2为组成型强启动子, 与 HBM 信号肽协同, 使得重组蛋白能够在昆虫细胞中进行连续分泌培养质粒 C 端有可选的 V5 抗原和 His 标签,方便重组蛋白检测和纯化 外源基因插入载体后在大肠杆菌中扩增, 纯化后转染宿主细胞 一旦宿主细胞成功表达重组蛋白,即可利用灭瘟素抗性进行筛选,获得高拷贝的细胞株进行连续发酵 IS 系统使用的质粒很小() ,易于操作,表达流程相对简单,可以进行连续发酵,有些重组蛋白在 IS 中的表达量比 BEVS 还高,是一种比较实用的昆虫表达系统。
表 3:昆虫表达载体 pMIB/V5-His B 质粒图谱 果蝇表达系统(Drosophila Expression System,DES): 果蝇表达系统使用 S2 果蝇细胞为表达宿主,可以进行重组蛋白的胞内、分泌表达,可以连续表达在培养瓶中,S2 松散半贴壁单层生长,同时也可以很好的适应摇瓶和发酵罐的悬浮培养, 可以使用无血清培养基 外源基因在 S2 细胞系一般能够达到 500-1000 个拷贝DES 有多种表达载体,包括组成型/诱导表达、胞内/分泌表达,可以适应不同的需要 诱导表达的载体使用果蝇金属硫蛋白基因(MT)启动子MT 启动子是一个严紧调控的强启动子, 即使在很高的拷贝数下也可以维持低水平的本底表达 硫酸铜或氯化镉可以解除抑制,表达 MT 启动子的下游基因MT 启动子在其他昆虫细胞系(如 Sf9,Sf21,High Five)中表现不佳,仅能在 S2 细胞系中使用 DES 的表达载体均没有果蝇细胞的筛选标记,只能用于短期表达,要建立稳定表达的细胞株, 必须将带有外源基因的载体和筛选载体共转染 常用的筛选载体有携带潮霉素抗性基因的pCoHygro和携带灭瘟素抗性基因的pCoBlast。
将筛选载体和表达载体共转染宿主细胞,即可根据宿主耐药性选出高拷贝的细胞株 图 4:果蝇细胞表达载体 pMT/V5-His 质粒图谱 果蝇表达体统常用载体 启动子 表达类型 细胞定位 融合标签 pMT/V5-His MT 诱导 胞内 V5,His V5-His Ac5 组成 胞内 V5,His pMT/BiP/V5-His MT 诱导 分泌 V5,His pMT/BioEase –DEST MT 诱导 胞内 生物素 表 8:果蝇表达体统常用载体 昆虫细胞表达优化: 检查外源基因的一级序列:外源基因 5’端不能有回文结构;密码子构成需要适应宿主的密码子偏好,特别是 N 端前几个;高 AT 含量的序列会使转录提前中止;检查重组蛋白序列,分泌表达时需要糖基化位点 Asn-X-Ser/Thr,避免蛋白 N 端出现“PEST”——脯氨酸、谷氨酸、丝氨酸、苏氨酸,N 端 PEST 使重组蛋白容易降解 尝试各种外源基因-载体-宿主组合:不同的载体-宿主体统适合表达的蛋白是不同的,重组蛋白表达量不高时应多尝试几种组合 宿主细胞状态:杆状病毒应在适合的时机感染宿主细胞,生长阶段、细胞密度、病毒量、收获时间都值得优化,特别是使用无血清培养基时,细胞密度要相应增加。
诱导表达系统同样如此 培养基:培养基成分对重组蛋白表达量和质量都有影响,可以考虑增加或减少培养基中某种组分(如血清等) ,也可以考虑将几种培养基按比例混合使用 转速和溶氧量:娇嫩的昆虫细胞不一定能适应高转速培养,这就使培养基中的溶氧量受到了限制,优化转速使细胞状态达到最佳,发酵培养时还应优化培养基氧气饱和度,以提高外源蛋白的表达量 共表达辅助因子:在杆状病毒表达系统中,过表达抗凋亡基因,如人源 bcl-2 和杆状病毒 P35 可以延长宿主寿命;P-vank-1 基因则可以提高分泌表达量 Recent patents on the Pichia pastoris expression system: expanding the toolbox for recombinant protein production. Recent patents on biotechnology 3, 192-201 (2009). Cregg, . et al. Expression in the yeast Pichia pastoris. Methods in enzymology 463, 169-189 (2009). Hamilton, . & Gerngross, . Glycosylation engineering in yeast: the advent of fully humanized yeast. Current opinion in biotechnology 18, 387-392 (2007). 5. 哺乳动物表达系统 与其它系统相比, 哺乳动物细胞表达系统的优势在于能够指导蛋白质的正确折叠, 提供复杂的 N-糖基化和准确的 O-糖基化等多种翻译后加工功能,因而表达产物在分子结构、理化特性和生物学功能方面最接近于天然的高等生物蛋白质分子。
表达宿主: 哺乳动物细胞表达外源蛋白最初是将抗体基因重新导人淋巴细胞中由病毒(如 SV40)或lgG 的启动子增强子引导产生的抗体具有相应的结合能力和数应功能,但表达量很低 常用的非淋巴细胞类有中国仓鼠卵巢(CHO)细胞、 小仓鼠肾(BHK)细胞、 非洲绿猴肾 (COS)细胞、人类肾细胞(293) 、幼仓鼠肾细胞(BHK)等不同宿主表达的重组蛋白其稳定性和翻译后修饰有所不同,需根据目的蛋白选择最佳的宿主细胞 CHO 细胞是目前较常用的哺乳动物宿主细胞,被美国 FDA 确认为安全的基因工程受体细胞(GRAS) ,广泛应用于医疗用重组蛋白的生产它遗传背景清楚,生理代谢稳定,与人的亲缘关系接近,外源蛋白修饰准确,基因转移和载体表达系统完善,对剪切力的耐受性好,便于大规模培养,而且能在无血清和蛋白培养基中生长缺点是产率较低,重组蛋白一般仅占细胞总蛋白的% CHO 细胞有多种亚细胞株, 如脯氨酸缺陷型 CHO-K1、 紫外线敏感型 UV20、UV41,二氢叶酸还原酶双倍体基因缺失型(DHFR-) CHO 和转入了胰岛素生长因子 IGF 基因和转铁蛋白基因、更加适应无血清培养基的超级 CHO 等。
COS 细胞是进行外源基因瞬时表达时最常用的宿主,源于 1-1 细胞株,基因组内含有腺病毒 SV40 的 T 抗原基因,允许 SV40 进行裂解生长,允许 SV40 早期突变体的复制COS 细胞载体易于构建,便于使用,而且对插入 DNA 的量或者采用基因组 DNA 序列的情况都没有什么限制, 可以通过检测表达情况来确证cDNA的阳性克隆, 也利于快速分析引入克隆化cDNA序列中的突变 来源于 MadIin-Darby 犬肾的高分化内皮细胞株(MDCK),悬浮培养时重组蛋白产率可以达到细胞总蛋白量的 20%,在细胞单层贴壁培养情况下表达量也可达到 10 mg/L在多种肾细胞获得成功后,人源肾脏细胞 293 细胞也经过改造成为常用的表达宿主293 细胞株整合了人类腺病毒 5DNA 的片段,显著强化了宿主的部分启动子,使得重组蛋白可以达到较高的表达量293 细胞能在无血清培养基中生长,其变种有快速生长型 293-F、整合了猴腺病毒大T抗原的293-FT、 融合了腺病毒部分基因的AD293和HEK293、 贴壁好适宜锚定筛选的293-H等 表达载体 与酵母和昆虫细胞类似, 哺乳动物细胞表达外源重组蛋白也可以利用质粒转染和病毒载体的感染。
病毒载体 哺乳动物可用的病毒载体很多,有猿猴空泡病毒(SV40) 、腺病毒(Adenovirus) 、腺相关病毒 (Adeno-associated virus) 、 人牛痘病毒 (Vaccinia virus) 、 杆状病毒 (Baculovirus) 、冠状病毒(Coronavirus) 、埃-巴二氏病毒(Epstein-Barr virus) 、单纯疱疹病毒(Herpes simplex virus) 、慢病毒(Lentiviruses) 、脊髓灰质炎病毒(Poliovirus) 、逆转录病毒(Retroviruses) 、塞姆利基森林病毒(Semliki Forest virus)等不同的病毒载体能够裂解增殖或复制的宿主各不相同,应根据需要选择 腺病毒(Adenovirus) : 腺病毒为线状双链 DNA 病毒,基因组长 36kb,DNA 两端各有一个反向重复序列 ITR腺病毒宿主范围广,可感染一系列哺乳动物细胞,其中人源细胞是腺病毒的允许细胞,腺病毒可以完成复制增殖裂解宿主的周期,不会插入人源细胞基因组中,因而不会致癌;而对啮齿动物,大部分腺病毒都可以致癌腺病毒基因按转录时间的先后,可以分为早期(E1-E4)和晚期转录单位(L1-L5) 。
E1 蛋白调节细胞代谢并激活其他早期基因的启动子,E2 启动病毒 DNA 复制,E3 与病毒复制无关,主要帮助病毒的成熟,E4 主要与病毒 mRNA 的代谢有关 pAdEasy-1 载体以人腺病毒 AD5 基因组为蓝本, 敲除了 E1 和 E3, 扩大载体容量的同时,使病毒不能在非允许细胞中复制 目的基因首先克隆在一个带有 ITR 和筛选标记的穿梭质粒(如 pShuttle-CMV)中,线性化后与 pAdEasy 共转染大肠杆菌,以抗生素筛选带有重组病毒的原核宿主,提取纯化后在融合有腺病毒 E1 基因的 293 细胞株(如 AD293)中增殖和表达重组病毒中,表达盒插入在腺病毒 E1 区,使用 E1 强启动子表达重组蛋白 使用人源细胞株作为表达宿主时,腺病毒载体最终会裂解宿主,因此不适于连续表达 慢病毒(Lentivirus) : 慢病毒是逆转录病毒的一种, 由潜伏期较长而得名 慢病毒既可以转染处于有丝分裂活跃期的细胞, 又可以转染分裂缓慢及处于分裂终末期的细胞, 包括造血干细胞, 神经干细胞,处于分化终末的神经元,肝实质细胞等根据其来源不同,慢病毒可以分为以下几类:HIV I型、HIV II 型、猿类免疫缺陷病毒、猫免疫缺陷病毒。
其中 HIV I 型是目前最常用的慢病毒载体慢病毒感染宿主细胞后马上形成前病毒,前病毒的主要基因编码区为5’LTR-Ψ-gag-pro-pol-env-3’LTR,其中 LTR 为长末端重复序列、Ψ 为整合信号,gag基因编码病毒的核心蛋白,pol 基因编码病毒复制所需的酶类,env 基因编码病毒的包膜糖蛋白,pro 基因则编码切割蛋白前体所需的蛋白酶 HIV-I 载体系统由辅助和载体两个质粒组成载体质粒含有整合信号 Ψ、启动子、多克隆位点以及包装、逆转录和整合所需的序列;辅助质粒则与载体互补,编码了产生病毒颗粒所必须的蛋白将两个质粒共转化到宿主中,由于辅助质粒不含整合信号,新生成的病毒中就只有目的基因将重组病毒感染普通表达宿主,即可进行重组蛋白的稳定表达;如感染整合了 gag、pol、env 基因的宿主,即可进行瞬时表达 慢病毒表达系统的一个主要缺陷是: 载体和辅助质粒有时会在宿主中发生同源重组, 产生野生型病毒为了解决这个问题,目前使用的表达系统将辅助质粒又分成了三个质粒,分别带有逆转录酶 rev 基因、gag 和 pol 基因、以及 env 的替代基因 VSV-G(囊口腔炎病毒外壳蛋白) 。
将载体系统分成 4 个部分增加了野生病毒生成所需的重组步骤,使得 HIV 载体系统更加稳定; 外壳蛋白的单独构建, 使得人们可以通过更换病毒外壳蛋白质粒来方便的更换宿主种类 单质粒表达载体 以为例,它是一个不依赖病毒的载体,组成元件有人巨细胞病毒早期启动子 pCMV、多克隆位点、用于真核筛选的遗传霉素抗性基因、f1 和 SV40 复制子、polyA 转录终止信号,以及原核复制子和氨苄青霉素抗性基因 载体的使用与类似的昆虫表达载体相同: 将目的基因克隆入载体中, 在原核宿主中扩增纯化,转染真核表达宿主,使用 G418 筛选高表达细胞株载体很小() ,易于操作,宿主溶源 SV40 病毒时可以独立于染色体自主复制;但是其表达流程复杂,对质粒载体纯度和转染效率要求很高,筛选工作费时费力,而且表达盒的插入位点和拷贝数不可控制,可能影响宿主生理性质使用 Flp-In 宿主细胞株可以克服这些缺点 图 5:A:Flp-In CHO 细胞系;B:pEF/FRT/V5-DEST 质粒图谱 常用的哺乳动物细胞株,如 CHO、293 等都可以改造为 Flp-In 细胞株序列 SV40 启动子—ATG—FRT—lacZ-Zeocin 整合在基因组中活跃表达的区域(图 5 A) ,使用博来霉素筛选宿主基因型, 带有外源基因的表达盒插入FRT位点, 保证了目的基因的正确整合。
使用Flp-In细胞株必须配合表达 pOG44 质粒和带有 FRT 重组序列的表达载体,如 pEF/FRT/V5-DEST(图5 B)pOG44 带有编码了 Flp 重组酶的基因,将其与表达载体共转染,Flp 重组酶帮助表达盒插入宿主染色体的 FRT 位点,即可获得稳定表达重组蛋白的细胞株 除以上介绍的两种载体外,还有多种单质粒载体可供选择(表 9) 载体 启动子 融合标签 筛选标记 其他 V5-DEST CMV V5 新霉素 带有 TEV 蛋白酶切位点 V5-DEST CMV V5 新霉素 V5-DEST CMV V5 灭瘟素 GFP-DEST CMV GFP 灭瘟素 pcDNA-DEST40 CMV V5,His 新霉素 pcDNA-DEST47 CMV GFP 新霉素 pcDNA-DEST53 CMV GFP 新霉素 pDEST26 CMV His 新霉素 pDEST27 CMV GST 新霉素 pEF-DEST51 hEF-1α V5,His 灭瘟素 pEF/FRT/V5-DEST hEF-1α V5 潮霉素 带有 FRT 重组序列 表 9:常用哺乳动物单质粒表达载体,新霉素是遗传霉素类似物,也可用 G418 筛选 四环素诱导表达系统: 四环素诱导表达载体是基于大肠杆菌四环素操纵子而设计的。
大肠杆菌中, 四环素抗性蛋白 (TetR) 调控着 Tn 10转座子上的四环素抗性操纵子 TetR 结合在tet操纵序列 (tetO)上,抑制下游基因的转录当环境中存在四环素时,四环素结合在 TetR 上,使其构象发生改变,从 DNA 上脱落而解除抑制TetR 和 tetO 为哺乳动物四环素诱导表达系统提供了调控与诱导表达的基础 哺乳四环素诱导表达系统有两种:Tet-On 和 Tet-Off(图 6) Tet-On 系统在培养基中添加 Dox(四环素类似物)时诱导外源基因表达;Tet-Off 则在培养基去除 Tet 或 Dox 时诱导外源基因表达这两种系统都由 2 个质粒组成:带有经过改造的 TetR 的调控质粒和 tetO及目的基因的表达质粒 在 Tet-Off 的调控质粒中, TetR 的 N 端 1-207 与单纯疱疹病毒 VP16 的活性结构域 (TA)融合,形成一个新的转录调控蛋白 tTAtTA 的功能与 TetR 相反,是一个转录激活因子,结合四环素或 Dox 时不能结合 DNA,表达被抑制,去除配体时蛋白结合在操纵序列上,诱导外源基因表达 在 Tet-On 的调控质粒中,tTA 经过 4 个氨基酸残基的突变,被改造成抑制转录的“反向”tTA(rtTA) 。
rtTA 只应答 Dox,四环素不能启动转录结合有 Dox 的 rtTA 能够同时结合操纵序列并启动转录,反之则从 DNA 上脱落,抑制转录 除调控蛋白编码基因外,两个系统的调控质粒上还带有 CMV 启动子、新霉素抗性基因、polyA 终止子、氨苄青霉素抗性基因及原核复制子 Col E1可以使用 G418 筛选稳定转染的细胞株 Tet-On 和 Tet-Off 系统共用一种表达质粒 其中, tetO 的连续 7 个拷贝和最小化的 CMV启动子组成了 Tet 应答启动子 hCMV*-1,当调控蛋白(tTA 或 rtTA)结合在启动子上时,下游的外源基因得到转录将调控质粒和表达质粒共转染宿主细胞,利用 G418 筛选,即可获得诱导表达重组蛋白的稳定细胞株由于四环素和 Dox 的半衰期较短,使用 Tet-On 系统需要在诱导后定时添加 Dox,Tet-Off 则需要在诱导前定时补加 四环素诱导表达系统有很多优点:严紧调控,本底表达量低;使用转录激活蛋白而不是抑制蛋白, 进一步降低了本底表达, 并减少了响应时间; 特异性强, 操纵子来源于原核生物,与表达宿主的同源性很低, 调控蛋白只结合表达质粒上的操纵序列; 表达量与诱导剂浓度正相关,可以较精确的控制。
除基本的 Tet-On/Off 系统外,还有严紧调控的 pTRE-Tight 载体、带有报告基因的pTRE-Tight-DsRed2 载体、 经过进一步改造更加适应哺乳动物宿主的 Tet-On/Off 3G 载体等,使用时可以根据需要选择 图 6:Tet-Off 和 Tet-On 诱导表达系统 哺乳动物表达系统的优化: 细胞状态:脆弱的哺乳动物细胞对培养环境十分敏感,营养和生长因子缺乏、缺氧、病毒感染、 毒性代谢物的积累、 机械搅动以及培养压力的增加等很多固素都可导致细胞停止生长甚至凋亡 哺乳动物细胞的遗传和生理背景复杂多变, 每个细胞株都最好单独摸索最优培养条件,尤其是稳定表达的细胞株,有较大的个体差异 抑制细胞凋亡: 过早发生的细胞凋亡不仅降低了细胞表达重组蛋白的时间, 死亡细胞释放的蛋白酶和糖苷酶还会严重影响重组蛋白质量 在宿主细胞中过表达 Bcl-12 和 BcI-x (L)基因能抑制多种因素诱发的细胞凋亡;使用诱导表达的载体,如 Tet-On/Off 时,可以将抑制细胞生长的 P27 基因串联入表达载体, 在诱导重组蛋白表达的同时控制细胞增殖; 添加能够抑制凋亡小分子也可以延长宿主寿命,如乙酰半胱氨酸 tNAC、吡咯烷二硫氨基甲酸酯(PDTC)以及 caspase 抑制剂 Z-VAD fmk 等。
控制细胞代谢:减少培养基中葡萄糖和谷胱甘肽的量,可以改变细胞代谢,减少伤害细胞状态的代谢产物的生成,使细胞培养达到一种稳定状态 内含子: 在哺乳动物细胞有时不能有效地表达没有内含子的基因; 一些内含子还能够强化转录和翻译, 提高重组蛋白表达量 选用宿主细胞本身能够高表达的蛋白内含子是个较为稳妥的办法 6. 体外表达系统 与其他表达系统相比,体外表达十分方便快捷,只需几个小时即可从 cDNA 得到表达产物,背景表达很低,尤其适用于快速小量的蛋白表达、组学研究以及高通量筛选但是由于缺少必要的细胞器和结构, 体外表达不能对重组蛋白进行翻译后修饰, 同时成本高、 产量低、不能连续表达也是其显著缺陷 大肠杆菌提取物 大肠杆菌的蛋白合成机制十分清楚,包括整个合成组分和反应的结构、遗传学、代谢和调节这使得大肠杆菌提取物成为最早出现、最常用的体外表达系统此系统耐受性很好,可以容忍很多外源物质,如氧化环境、蛋白酶抑制剂、分子伴侣、非天然氨基酸、同位素或非放标记等相对于其他体外表达系统而言,大肠杆菌提取物成本最低,实用性高,表达效率和表达量也最高 兔网织红细胞裂解液 网织红细胞由红细胞分化而来,主要负责合成大量血红蛋白(90%以上) ,以及球蛋白。
与红细胞相同,网织红细胞没有细胞核,背景表达低,核酸酶很少,有助于 mRNA 的稳定,表达重组蛋白的能力极强通过去除少量的内源 mRNA 和核酸酶,兔网织红细胞裂解液合成外源蛋白的效率得到进一步提高, 接近于完整细胞合成内源蛋白的效率, 是较理想的体外表达系统,其缺点是成本较高 麦芽提取物 麦芽提取物是一种经济实用的真核体外表达系统其内源的 mRNA 很少,可用于各种病毒、酵母、高等动植物蛋白的合成当表达产物较难与球蛋白区分(12—15kD) 、或是易受宿主干扰的哺乳动物蛋白, 就不妨尝试麦芽提取物体系 这个体系要求 RNA 有帽子结构才能更好的翻译,表达量偏低 重组元件系统 在重组元件系统中,除了来自大肠杆菌的高度纯化核糖体和 rRNAs 外,其余组份都是重组而来的,如 tRNA 合成酶、起始因子、延伸因子、释放因子、能量再生系统等此系统成分清楚,背景表达极低,避免了核酸外切酶,RNase 和蛋白酶的污染,使 DNA 模板不被降解,表达的蛋白也不会有任何降解和修饰所有重组蛋白元件都带有 His 标签,可以很方便的去除 7. 小结 蛋白质的重组表达技术已经渗透到生命科学的各个研究领域,尤其在蛋白质三维结构测定、免疫研究、生化研究、疫苗与新医药等方面发挥着重要作用。
目的蛋白能否成功表达涉及到蛋白本身、宿主和载体、表达条件的方方面面,情况异常复杂因此,尽管现有表达系统不断完善、表达技术日臻成熟,依然没有一个完美的方案能够适应所有蛋白的需要,每一个新蛋白都会带来新问题, 重组蛋白的表达仍是充满变数和个性的实验 详细了解目的蛋白,选择恰当的表达系统,采用有效的优化方案,是表达重组蛋白的三部曲,充分理解这三个步骤,在实验中积累经验并不断创新,表达工作就可事半功倍。





