
实验二_数据库相似性搜索与序列比对.docx
3页实验二数据库相似性搜索与序列比对实验原理:数据库相似性搜索以两两序列比对为基础,将感兴趣的基因序列与序列数据库中的每 个序列进行比较,鉴别出相似的序列搜索结果显示出与最佳匹配序列的对位排列及匹配记分序列数据库搜索对发现基因的功能非常有效FASTA和 BLAST 是两个著名的用于数据库相似性搜索的软件包其中 BLAST(Basic Local A1ignment Search Tool)基于局部比对的搜索工具,是一种启发式搜索算法服务软件,包括 BLASTP,BLASTN,BLASTX,TBLASTN 和 TBLASTX 程序实验目的与要求:学习数据库相似性检索和序列比对的程序的使用,能够理解程序给出的结果,从中获取有关功能和结构的信息1) 要求学生运用已经学习过的数据库检索方法在数据库中检索特定的基因(2) 掌握数据库相似性搜索工具BLAST 的基本比对方法,参数设置及结果分析(3) 掌握核酸和蛋白质两序列比对方法、参数设置及结果分析实验材料:未知核酸序列;未知氨基酸序列;SOD 基因工具软件:(1) 数据库检索工具ENTREZ(2) 数据库相似性搜索工具BLAST (www.ncbi.nlm.nih.gov/blast)(3) 两序列比对工具Align two sequences (bl2seq)一、利用BLAST 中的 Special 类下的 Align two sequences (bl2seq) 比较人与老鼠的 SOD 基因蛋白质序列的相似性程度(1) 利用NCBI的ENTREZ检索蛋白质数据库获得人AAB27818.1和老鼠3GTT_E的SOD 基因氨基酸序列或者登录号(SOD分为SOD1或SOD2等,注意检索时选择完全相同的SOD基因)(2) 进入NCBI 的BLAST 网页,选择Specialized BLAST下的Align two sequences(bl2seq)程序进行两序列比对(3) 选择blastp子程序,将序列或登录号分别粘贴到序列框中(4) 其他选项采用默认的设置,运行程序(5) 分析结果,并回答以下问题在NCBI的ENTREZ检索中使用的关键词是什么?Human and sod mouse and sod人和老鼠的SOD 基因的蛋白质序列的登录号分别是? 人AAB27818.1和老鼠3GTT_E两序列比对得到的一致性百分比和相似性百分比分别为多少?Identities127/153(83%)Positives135/153(88%)两序列比对结果中哪些区域出现了gap?Gaps0/153(0%)二、利用 SPECIELIZED BLAST 的 Conserved Domain 进行蛋白质保守结构域分析(1) 进入NCBI 的BLAST 网页(2) 选择Specialized BLAST 下的Conserved Domain 超链接进入(3) 在Cazy 数据库查找一个糖苷水解酶Glycoside Hydrolases(GH+学号),获得其蛋白质序列或蛋白质序列的Genbank 登录号 AEK59386.1(4) 将糖苷水解酶的登录号或蛋白质输入到Conserved Domain 页面的输入框内(5) 参数选择默认即可,点击submit 提交进行分析(6) 阅读得到的结果,点击各HIT 的超链接了解找到的结构域的功能(7) 将结构域图形和表格记录在实验报告中三、利用 BLAST 在数据库中搜索不同物种的同源基因Actinosynnema mirum DSM 43827, complete genome(1) 利用文献检索工具检索Clostridium thermocel嗜lu热m梭菌与其纤维素降解功能相关的基因,例如糖苷水解酶Glycoside Hydrolases(GH+学号)或多糖裂解酶Polysaccharide Lyases (PLs)或碳水化合物酯酶Carbohydrate Esterases (CEs)等(2) 利用NCBI的ENTREZ检索该基因获得其核酸序列AB125373或者利用(二)中的蛋白质登录号在ncbi数据库中通过related information链接到核酸数据库,获得该基因的核酸登录号或序列(3) 利用BLASTn进行数据库相似性搜索搜索其他微生物中的同源基因(4) 分析BLAST结果,并回答以下问题检索获得基因名称是?chi19-1该基因的登录号是多少?AB125373进行BLASTn 搜索的数据库选项为?nr请列举 3-5 个具有该基因的同源基因的其他微生物及其同源基因的登录号?Streptomyces griseus subsp. griseus NBRC 13350 DNA, complete genomeAP009493.1Streptomyces griseus gene for chitinase C, complete cdsAB009289.1 Amycolatopsismediterranei U32, complete genomeCP002000.1 Amycolatopsis mediterranei RB, complete genomeCP003777.1Streptomyces sp. Mg1, complete genome CP011664.1。












