
蛋白质二级结构+预测软件收集.pptx
38页蛋白质二级结构预测软件蛋白质二级结构的预测通常被认为是蛋白结构预测的第一步,二级结构是指螺旋和折叠等规则的蛋白质局部结构元件不同的氨基酸残基对于形成不同的二级结构元件具有不同的倾向性按蛋白质中二级结构的成分可以把球形蛋白分为全蛋白、全蛋白、蛋白和/蛋白等四个折叠类型o预测蛋白质二级结构的算法大多以已知三维结构和二级结构的蛋白质为依据,用过人工神经网络、遗传算法等技术构建预测方法o目前较为常用的几种方法有:PHD、PSIPRED、Jpred、PREDATOR、PSA,其中最常用的是PHDPHD结合了许多神经网络的成果,每个结果都是根据局部序列上下文关系和整体蛋白质性质(蛋白质长度、氨基酸频率等)来预测残基的二级结构那么,最终的预测是这些神经网络每个输出的算术平均值这种结合方案被称为陪审团决定法(jurydecision)或者称为所有胜利者(winner-take-all)法PHD被认为是二级结构预测的标准总的来说,二级结构预测仍是未能完全解决的问题,一般对于螺旋预测精度较好,对折叠差些,而对除螺旋和折叠等之外的无规则二级结构则效果很差oPHD的使用请见人工神经网络方法中的“基于人工神经网络模型的预测软件PHDsec使用简介”.onnPredict:http:/www.cmpharm.ucsf.edu/nomi/nnpredict.htmlonnpredict算法使用了一个双层、前馈神经网络去给每个氨基酸分配预测的类型。
在预测时,服务器使用FASTA格式的文件,其中有单字符或三字符的序列以及蛋白质的折叠类(、或/)残基被分为几类,如螺旋(H)、链(E)或其它()若对给定残基未给出预测,则会标上问号(?),这说明无法作出可信的分配若没有关于折叠类的信息,预测也能在不定折叠类的情况下进行,而且这是缺省的工作方式据报道,对于最佳实例的预测,nnpredict的准确率超过了65%oPredictProtein:http:/cubic.bioc.columbia.edu/predictprotein/o国内镜像:http:/ PI/MW http:/expaxy.hcuge.ch/ch2d/pi-tool.htmlPeptidemasshttp:/expaxy.hcuge.ch/sprot/peptide-mass.html TGREASE ftp:/ftp.virginia.edu/pub/fasta/ SAPS http:/ulrec3.unil.ch/software/SAPS_form.html基于组成的蛋白质识别预测AACompIdent http:/expaxy.hcuge.ch/ch2d/aacompi.htmlAACompSim http:/expaxy.hcuge.ch/ch2d/aacsim.html PROPSEARCH http:/www.embl-heidelberg.de/prs.htmlo基于组成的蛋白质识别预测AACompIdenthttp:/expaxy.hcuge.ch/ch2d/aacompi.htmlAACompSimhttp:/expaxy.hcuge.ch/ch2d/aacsim.htmlPROPSEARCHhttp:/www.embl-heidelberg.de/prs.htmlo二级结构和折叠类预测nnpredicthttp:/www.cmpharm.ucsf.edu/nomi/nnpredictPredictproteinhttp:/www.embl-heidelberg.de/predictprotein/SOPMAhttp:/www.ibcp.fr/predict.htmlSSPREDhttp:/www.embl-heidelberg.de/sspred/ssprd_info.htmlo特殊结构或结构预测COILShttp:/ulrec3.unil.ch/software/COILS_form.htmlMacStripehttp:/www.wi.mit.edu/matsudaira/macstripe.htmlo与核酸序列一样,蛋白质序列的检索往往是进行相关分析的第一步,由于数据库和网络技校术的发展,蛋白序列的检索是十分方便,将蛋白质序列数据库下载到本地检索和通过国际互联网进行检索均是可行的。
由NCBI检索蛋白质序列可联网到:“http:/www.ncbi.nlm.nih.gov:80/entrz/query.fcgi?db=protein”进行检索利用SRS系统从EMBL检索蛋白质序列联网到:http:/srs.ebi.ac.uk/”,可利用EMBL的SRS系统进行蛋白质序列的检索o通过EMAIL进行序列检索当网络不是很畅通时或并不急于得到较多数量的蛋白质序列时,可采用EMAIL方式进行序列检索蛋白质基本性质分析蛋白质序列的基本性质分析是蛋白质序列分析的基本方面,一般包括蛋白质的氨基酸组成,分子质量,等电点,亲水性,和疏水性、信号肽,跨膜区及结构功能域的分析等到蛋白质的很多功能特征可直接由分析其序列而获得例如,疏水性图谱可通知来预测跨膜螺旋同时,也有很多短片段被细胞用来将目的蛋白质向特定细胞器进行转移的靶标(其中最典型的例子是在羧基端含有KDEL序列特征的蛋白质将被引向内质网WEB中有很多此类资源用于帮助预测蛋白质的功能o疏水性分析位于ExPASy的ProtScale程序(http:/www.expasy.org/cgi-bin/protscale.pl)可被用来计算蛋白质的疏水性图谱。
该网站充许用户计算蛋白质的50余种不同属性,并为每一种氨基酸输出相应的分值输入的数据可为蛋白质序列或SWISSPROT数据库的序列接受号需要调整的只是计算窗口的大小(n)该参数用于估计每种氨基酸残基的平均显示尺度o进行蛋白质的亲/疏水性分析时,也可用一些windows下的软件如,bioedit,dnamana等o跨膜区分析有多种预测跨膜螺旋的方法,最简单的是直接,观察以20个氨基酸为单位的疏水性氨基酸残基的分布区域,但同时还有多种更加复杂的、精确的算法能够预测跨膜螺旋的具体位置和它们的膜向性这些技术主要是基于对已知跨膜螺旋的研究而得到的自然存在的跨膜螺旋Tmbase数据库,可通过匿名FTP获得(http:/www.isrec.isb-sib.ch/ftp-server/tmbase),参见表一资源名称网址说明TMPREDhttp:/www.ch.embnet.org/software/TMPRED_form.html基于对tmpred数据库的统计分析PHDhtmhttp:/www.embl-heidelberg.de/se.tprotein.htmlMEMSATftp:/ftp.biochem.ucl.ac.uko微机版本蛋白质序列含有跨膜区提示它可能作为膜受体起作用,也可能是定位于膜的锚定蛋白或者离子通道蛋白等,从而,含有跨膜区的蛋白质往往和细胞的功能状态密切相关。
http:/genome.cbs.dtu.dk/sevices/TMHMM-2.0“或“http:/www.ch.embnet.org/software/TMPRED_form.html”o前导肽与蛋白质定位在生物内,蛋白质的合成场所与功能场所常被一层或多层细胞膜所隔开,这样就涉及到蛋白质的转运合成的蛋白质只有准确地定向运行才能保证生命活动的正常进行一般来说,蛋白质的定位的信息存在于该蛋白质自身结构中,并通过与膜上特殊的受体相互作用而得以表达在起始密码子之后,有一段编码疏水性氨基酸序列的RNA片段,这个氨基酸序列就这个氨基酸序列就是信号肽序列含有信号肽的蛋白质一般都是分泌到细胞外,可能作为重要的细胞因子起作用,从而具有潜在的应用价值http:/genome.cbs.dtu.dk/sevices/signalP-2.0o卷曲螺旋分析另一个能够直接从序列中预测的功能motif是-螺旋的卷曲排列方式在这种结构中,两种螺旋通过其疏水性界面相互缠在一起形成一个十分稳定的结构蛋白质卷曲的相关资源资源网址coiled-coilhttp:/www.york.ac.uk/depts/biol/units/coils/coilcoil.htmlCOILShttp:/www.ch.embnet.org/software/COILS_form.htmlEpitopeInfohttp:/epitope-。












