如何寻找miRNA靶基因?.pdf
10页如何寻找如何寻找 miRNAmiRNA 靶基因?靶基因?microRNA(miRNA)是一类能够调节基因表达的短单链內源非编码 RNA(约 22nt) ,通过与互补的mRNA 选择性地结合抑制蛋白的产生,广泛存在于动物、植物、病毒等多种有机体中miRNA 通常位于基因间或者内含子区域,在细胞核内有RNA 聚合酶Ⅱ转录产生具有帽子结构多聚腺苷酸尾巴的pri-miRNA在核酸酶 Drosha 及其辅助因子Pasha 的作用下,pri-miRNA 被处理成 70 个核苷酸组成具有茎环结构的pre-miRNA,然后由 Exportin 5 等转运至细胞质 Dicer 将 pre-miRNA切割成约22nt 的双链miRNA, 双链 miRNA讲解形成单链的成熟miRNA 成熟 miRNA 还需要与 Argonaute蛋白等组装形成RNA诱导沉默复合体 (RISC) , RISC作用于特异mRNA的3’ UTR,从而抑制翻译过程或者直接讲解mRNA整个过程如图所示尽管对 miRNA 功能的认识还不是非常清楚,但miRNA 在许多生物过程中起关键作用,包括发育、细胞分化、增殖、凋亡、肿瘤转移等准确快速地预测 miRNA 靶基因对于研究 miRNA 功能以及分析miRNA 参与的生物学过程具有十分重要的意义。
目前寻找miRNA 靶基因的方法主要有生物信息学以及生物实验方法1、生物信息学方法生物信息学方法主要是利用某种算法对靶基因样本进行评分及筛选 生物信息学的方法只是通过算法为研究人员提供可能性最大的参考信息,还需要通过实验进行验证使用计算机预测植物 miRNA 靶基因比较简单,因为在植物中miRNA 与靶基因几乎还是以完全互补配对的方式结合, 预测不需要复杂的算法而预测动物 miRNA 靶基因则存在一定的困难,主要是目前已知的 miRNA 靶基因及其确切靶点不多,在算法编写时没有足够的已知样本可供参考 但是, miRNA与靶基因间的相互作用仍然具有一定的规律性目前常规的算法主要遵循以下几个常用原则: (a)miRNA 与靶基因的互补性;(b) miRNA 靶位点在不同物种之间的保守性; (c)miRNA-mRNA双链之间的热稳定性; (d)miRNA靶位点不会有复杂的二级结构; (e)miRNA 5’端于靶基因的结合能力强于3’端除了这些基本原则以外, 不同的预测方法还会根据各自总结的规律对算法进行限制和优化1)miRandamiRanda 是最早利用生物信息学对 miRNA 靶基因进行预测的软件,由 Enright等人[1]于 2003 年开发设计。
其对3’UTR 的筛选依据主要是从序列匹配、 miRNA与 mRNA 双链的热稳定性以及靶位点的保守性三个方面进行分析综合这 3 条原则,miRanda 选取每条 miRNA相对的 3’UTR 中排名前十位的基因,作为miRNA 的候选靶基因,对于多个 miRNA 对应于同一靶位点的情况, miRanda 使用贪心算法(Greedy Algorithm)选取其中得分最高且自由能最低的那一对[2](2)TargetScan和 TargetScanSTargetScan是 Lewis 等人[3]在 2003 年开发的一款用于预测哺乳动物 miRNA 靶基因的软件,该软件将RNA 间相互作用的热力学模型与序列比对分析相结合,预测不同物种间保守的miRNA 结合位点TargetScan还引入了信号噪声比来评估预测结果的准确度,所谓信号噪声比即用已知(信号组)和随机生成的 miRNA(噪声组)分别对mRNA 的 3’UTR 进行预测,所得靶基因数目的比值随着物种数目的增多,预测得到的靶基因减少,但准确性得到了相应的提高后来, Lewis等人[4]又对 TargetScan进行了优化, 即 TargetScanS。
TargetScanS在人、小鼠、大鼠的基础上增加了狗( Canis familiaris)和鸡(Gallus gallus)的基因组数据,同时在算法上做了改动3)RNAhybridRNAhybrid 是 Rehmsmeier等人[5]在 2004 年开发的一种基于分析miRNA 和靶基因间形成双链的二级结构,从而预测miRNA 靶基因的软件 RNAhybrid在实质上是一种经典RNA二级结构预测软件的扩展,能够快速、 准确地计算一条短链RNA和一条长链RNA 杂交 (如 miRNA和 mRNA 3’UTR)时的自由能,并基于此来预测果蝇中miRNA 的靶基因RNAhybrid的算法禁止分子内、 miRNA 分子间及靶基因间形成二聚体,根据 miRNA 和靶基因之间结合自由能探测最佳的靶位点4)DIANA-microTDIANA-microT是Kiriakidou[6]等人于2004年开发的一款结合了生物信息学和实验学方法的靶基因预测软件 DIANA-microT主要考虑单一结合位点的miRNA靶基因 此外在寻找结合位点时, 除了必需的5’端种子区外,典型的中央突起以及 miRNA在3’端与mRNA的结合也得到了考虑。
在算法方面,DIANA-microT主要基于以下两点原则对miRNA靶基因进行判断: 首先, 通过动态规划算法计算经典的 Watson-Crick碱基对及G: U错配的自由能, 进而衡量miRNA与靶基因间的结合能力;其次, miRNA相关蛋白影响miRNA与靶基因结合时形成的中央突起的大小与位置,进而影响miRNA与靶基因的结合5)PicTarKrek等人[7]在2005年采用一种更先进的算法来预测脊椎动物、线虫和果蝇中miRNA的靶基因,并通过实验方法进行了验证,这种算法就是PicTar,即组合靶位点的概率识别 (probabilisticidentification of combinations of target sites) PicTar的算法包括两个方面:识别单个miRNA的靶位点; 为组合的靶位点评分 通过生物信息学和实验方法的分析, PicTar算法估计会有30%左右的假阳性率6)RNA22RNA22是由Miranda等人[8]于2006年开发的一种识别miRNA靶位点以及相应miRNA-mRNA异源双链的软件 RNA22与其他miRNA靶基因预测软件不同首先,RNA22的预测不依赖于物种间的保守性,而是认为即使近亲物种不存在miRNA结合位点, 仍有可能是miRNA的靶基因; 其次,RNA22与其他软件的预测方向不同, RNA22不是从miRNA入手寻找它的靶基因,而是首先从感兴趣的序列入手,寻找假定的 miRNA结合位点,再进一步确定其被哪条 miRNA调控。
动物中miRNA靶基因预测方法预测方法预测方法miRandamiRandaTargetScan/TarTargetScan/TargetScanSgetScanSRNAhybridRNAhybridDIANA-microTDIANA-microTPicTarPicTarRNA22RNA22网址网址http://www.microrna.org/http://www.targetscan.org/http://bibiserv.techfak.uni-bielefeld.de/rnahybrid/http://www.diana.pcbi.upenn.edu/http://pictar.bio.nyu.edu/ 果蝇脊椎动物哺乳动物算法特点算法特点序列匹配, 双链结合自由能, 物种间保守性提出“miRNA种子区”的概念快速准确计算miRNA-mRNA二聚体自由能考虑miRNA调控单个靶位点的情况区分“完全匹配种子区”与“不完全匹配种子区”不考虑保守性, 由mRNA入手预测相关miRNA上述不同算法各有其特点,主要还是依据 miRNA与其靶位点的互补性、miRNA靶位点的保守性、miRNA-mRNA双链之间的热稳定性及附近序列的二级结构等原则设计的。
其中, miRanda是将miRNA-mRNA之间的序列匹配, 保守性及热稳定性作为计算参数, 有比较好的检出率,但是假阳性率也较高; TargetScan提出了“种子区”的概念,增加了预测的精确度; RNAhybrid的研究重点在RNA二级结构预测方面, 能够更快速准确地计算miRNA-mRNA双链的自由能,降低了假阳性率;DIANA-microT则主要考虑miRNA调控单个靶基因的情况,同时考虑中央突起以及miRNA在3’ 端与mRNA的结合;RNA22与其他算法不同,不考虑物种间的保守性,检出率较高2、生物学实验方法由于计算机模拟在预测miRNA靶基因时存在一定的局限性,因此很多学者也希望能够利用生物学实验方法直观地寻找 miRNA靶基因1) 从mRNA水平寻找miRNA靶基因(a)miRNA靶基因大规模寻找将miRNA成熟体双链或腺病毒载体转染至细胞中, 使得miRNA在细胞中过表达,之后利用基因芯片分析 mRNA的变化以找出相应miRNA的靶基因[9]由于miRNA在体内通过翻译抑制或影响 mRNA的稳定性起作用,因此这种方法在寻找起翻译抑制作用的 miRNA的靶基因时存在一定困难。
Beitzinger等人[10]利用AGO蛋白家族既能结合miRNA又能结合mRNA的特性, 分别使用AGO-1和AGO-2蛋白的单克隆抗体在人类细胞中进行免疫共沉淀,得到与AGO-1和AGO-2蛋白结合的mRNA各600条,并通过克隆测序对这些mRNA进行鉴定 同时, 从与AGO-1蛋白结合的mRNA中随机挑选6条进行荧光素酶报告基因检测,发现其中有 5条都是miRNA的靶基因与上述工作类似, Easow等人[11]也是利用纯化miRNP来分析miRNA的靶基因他们利用基因芯片分析了 miRNP结合的mRNA后发现,大量计算机预测的miRNA靶基因得到了富集, 同时为了分析单个miRNA的靶基因,对野生型果蝇和miR-1缺失果蝇的miRNP结合mRNA进行了分析,得到并利用实验方法鉴定miR-1调节的mRNA, 为miRNA靶基因的寻找提供了新的思路b)miRNA靶基因的精确寻找Liu等人[12]在研究Mir-16家族的功能时建立了一种针对 miRNA靶基因的反向筛选法首先,确定了感兴趣的基因 ccnd1,将它的3’ UTR构建到荧光素酶报告载体中,之后与构建的 miRNA表达文库共转染HepG2细胞,得到荧光值明显下降的 miRNA,再将得到的miRNA在体内验证其功能,最终得到Mir-16家族能够调节CCND1基因。
该方法的关键在于,利用了自行构建的 miRNA表达文库,能够方便同时研究多条miRNA,通过体外实验对候选miRNA进行初步筛选, 从而快速地鉴定一条mRNA所对应的多条miRNA2)从蛋白质水平寻找 miRNA靶基因由于miRNA所介导的转录后翻译抑制过程不引起 mRNA水平的改变,因此依据mRNA水平的变化寻找miRNA靶基因的方法在检出率上存在一定问题Selbach[13]和Baek[14]两个研究组分别利用蛋白质组学的研究方法,建立了从蛋白质水平寻找 miRNA靶基因的新方法两个课题组分别将成熟miRNA双链转染HeLa细胞,利用细胞培养稳定同位素标记技术(stable isotope labeling with amino acidsin cell culture),将转染了成熟miRNA双链的细胞和正常细胞分别培养于含轻/重型稳定同位素标记必需氨基酸的培养基中,经过若干次细胞倍增后, 稳定同位素按照序列特异的方式完全掺入到新合成的蛋白质中, 通过比较标记前后同一肽段的质谱峰值变化实现对蛋白质的精确定量,在检测了2000~5000个蛋白后,两个研究组分别发现,转染一条miRNA后有几百个蛋白的表达水平发生了改变,许多改变在mRNA水平上不能得到体现。
前面提到很多寻找miRNA靶基因的方法,这里也不得不提 miRNA靶基因的鉴定 与miRNA靶基因的预测方法相比, 对miRNA靶基因进行实验验证的方法并不多,目前还没有一个快速、简便、高通量的鉴定方法最直接的鉴定方法是,利用荧光定量 PCR及Western blot方法分别检测转染或敲低miRNA后细胞中mRNA水平及蛋白水平的变化,从而确定miRNA与靶基因的对应关系这种方法能够直接鉴定出 miRNA的靶基因,准确度高但不能鉴定 miRNA的靶位点目前最为常用的miRNA靶位点鉴定方法是荧光素酶报告基因法其基本原理是首先构建荧光素酶表达载体,将希望鉴定的 miRNA靶基因的3’UTR构建到荧光素酶基因的 3’UTR中;之后将构建好的载体转染细胞并改变细胞中相应miRNA的表达水平;最后检测荧光素酶的表达情况, 以分析转染3’UTR中是否含有miRNA的靶位点[1,15] 美国Signosis经过多年探索,积累了丰富的上述 miRNA靶基因荧光素酶报告载体实验相关的经验,可以帮助科研人员构建实用的 miRNA靶基因荧光素酶报告载体同时,有多种已构建完毕的载体可提供给研究人员使用( )。
除此之外,Signosis还提供miRNA研究中常用的实验试剂,如 miRNA芯片、miRNA Northern Blot、miRNA实时荧光定量PCR以及Signosis专利性的miRNA微孔板检测试剂等 ; ) 使用这些产品帮助研究人员解决了很多操作方面的麻烦, 发表了100多篇SCI文章参考文献:[1] Enright A J, John B, Gaul U, et al. MicroRNA targets in Drosophila.Genome Biol, 2003, 5(1): R1[2] John B, Enright A J, Aravin A, et al. Human microRNA targets. PLoSBiol, 2004, 2(11): e363[3 ]Lewis B P, Shih I H, Jones-Rhoades M W, et al. Prediction of mammalianmicroRNA targets. Cell, 2003, 115(7): 787—798[4] Lewis B P, Burge C B, Bartel D P. Conserved seed pairing, often ankedby adenosines indicates that thousands of human genes are MicroRNA targets.Cell, 2005, 120(1): 15—20[5]Rehmsmeier M, Steffen P, Hochsmann M, et al. Fast and effectiveprediction of microRNA/target duplexes. RNA, 2004, 10(10): 1507—1517[6] Kiriakidou M, Nelson P T, Kouranov A, et al. A combined computationalexperimental approach predicts human microRNA targets. Genes Dev, 2004,18(10): 1165—1178[7] Krek A, Grun D, Poy M N, et al. Combinatorial microRNA targetpredictions. Nature Genet, 2005, 37(5): 495—500[8] Miranda K C, Huynh T, Tay Y, et al. A pattern-based method for theidentification of microRNA binding sites and their correspond-ingheteroduplexes. Cell, 2006, 126(6): 1203—1217[9] Lim L P, Lau N C, Garrett-Engele P, et al. Microarray analysis showsthat some microRNAs downregulate large numbers of target mRNAs. Nature,2005, 433(7027): 769—773[10] Beitzinger M, Peters L, Zhu J Y, et al. Identification of humanmicroRNA targets from isolated argonaute protein complexes. RNA Biol,2007, 4(2): 76—84[11] Easow G, Teleman A A, Cohen S M. Isolation of microRNA targets bymiRNP immunopurification. RNA, 2007, 13(8): 1198—1204[12] Liu Q, Fu H, Sun F, et al. miR-16 family induces cell cycle arrestby regulating multiple cell cycle genes. Nucleic Acids Res, 2008, 36(16):5391—5404[13] Selbach M, Schwanhäusser B, Thierfelder N, et al. Widespread changesin protein synthesis induced by microRNAs. Nature, 2008, 455(7209):58—63[14] Baek D, Villén J, Shin C, et al. The impact of microRNAs on proteinoutput. Nature, 2008, 455(7209): 64—71[15] Welch C, Chen Y, Stallings R L. MicroRNA-34a functions as a potentialtumor suppressor by inducing apoptosis in neuroblastoma cells. Oncogene,2007, 26(34): 5017—5022。





