蛋白质结构与功能的生物信息学研究.doc
15页实验名称:蛋白质结构与功能的生物信息学研究实验目的:1.掌握运用BLAST工具对指定蛋白质的氨基酸序列同源性搜索的方法2.掌握用不同的工具分析蛋白质的氨基酸序列的基本性质3掌握蛋白质的氨基酸序列进行三维结构的分析4.熟悉对蛋白质的氨基酸序列所代表蛋白的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性的分析实验方法和流程:一、 同源性搜索同源性从分子水平讲则是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度BLAST工具能对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对,并从相应数据库中找到相同或相似序列对指定的蛋白质的氨基酸序列进行同源性搜索步骤如下:↓ 登录网址http://web.expasy.org/blast/↓输入序列后,运行blast工具↓序列比对的图形结果显示序列比对的图形结果:用相似性区段(Hit)覆盖输入序列的范围判断两个序列的相似性如果图形中包含低得分的颜色(主要是红色)区段,表明两序列的并非完全匹配↓匹配序列列表及得分可选择不同的比对工具各序列得分备注: Clustal是一款用来对()的软件。
可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助Clustal包括Clustalx和Clustalw(前者是图形化界面版本后者是命令界面),是生物信息学常用的多序列比对工具该序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.↓详细的比对序列的排列情况第一个序列的匹配率为100%第一个匹配序列Score表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度越大Expect是输入序列被随机搜索出来的概率,该值越小越好Identities是相似程度,即匹配率,100%表示序列全部匹配Method:代表不同的打分矩阵方法,选择不同的打分矩阵会得到不同的打分结果显示结果按越后面匹配率越低二、 分析蛋白质的氨基酸序列的基本性质ProParam是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinction coefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等↓登录网址:http://web.expasy.org/protparam并输入序列号↓↓蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。
结果1:该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、 S五种原子组成,共有19180个原子↓消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)结果2:消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白浓度由上图知,该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976半衰期为30小时(哺乳动物的网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)该蛋白不稳定系数为56.13,提示该蛋白质不稳定脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定性,为82.35. 蛋白质的疏水性预测可以根据GRAVY值来预测GRAVY值的范围在2 与-2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白该蛋白的GRAVY值为-0.247,因此预测该蛋白为亲水蛋白↓利用ProtScale工具对蛋白质进行亲疏水性分析↓登录网址http://web.expasy.org/protscale并输入序列号↓↓GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。
Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高的打分值(>0值表示疏水性,<0值表示亲水性从图可看出,标度值<0的区域比>0的较为密集,因此,结合上面的GRAVY值为-0.247,预测该蛋白为亲水蛋白↓利用TMPred工具对该蛋白进行跨膜区结构预测登录网址http://www.ch.embnet.org/software/TMPRED_form.html↓最优拓扑结构:2种模型都预测有4个蛋白质跨膜区↓用TMHMM预测是否存在跨膜区 登录网址http://www.cbs.dtu.dk/services/TMHMM-2.0/↓↓结果提示有2个蛋白质跨膜区其跨膜区比TMpred预测的结果少了2个少了序列前面2个位置的跨膜区三、 蛋白质三维结构分析↓登录网址http://swissmodel.expasy.org/,输入相应的序列号↓↓建模部分结果↓有A、B、C、D四条晶体结构的单链阵线四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性分析↓登录 EGFR)家族成员之一是白血病病毒致癌基因同族体2蛋白酪氨酸激酶(ERBB2基因表达产物)是几个细胞表面受体复合物的一部分,但这需要一个coreceptor配体结合。
Neuregulin受体复杂的重要组成部分,尽管neuregulin不单独与之交互GP30是一个潜在的配体受体调节产物和周边稳定微管(MTs)总结:该蛋白质序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195. 该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、 S五种原子组成,共有19180个原子该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976半衰期为30小时(哺乳动物的网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)该蛋白不稳定系数为56.13,结果提示该蛋白质不稳定脂肪系数为82.35.该蛋白的GRAVY值为-0.247,通过亲疏水性分析得出该蛋白为亲水蛋白三级结构分析显示该利用TMPred工具对该蛋白进行跨膜区结构预测得到4个跨膜区,而用TMHMM预测则存在2个跨膜区该蛋白质序列由4条链构成,通过相互作用分析得,该蛋白质序列相互作用的蛋白有10个,是表皮生长因子受体( EGFR)家族成员之一,参与细胞膜的表面受体的组成,与白血病的发生有关。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


