电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

山东大学生物信息学课件06-1序列比较1

60页
  • 卖家[上传人]:东***
  • 文档编号:281333315
  • 上传时间:2022-04-23
  • 文档格式:PPTX
  • 文档大小:5.91MB
  • / 60 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、生生 物物 信信 息息 学学序列比较序列比较 1 1认识序列认识序列序列(序列(sequence)就是个字符串()就是个字符串(string)。)。s=abcdefghijklmnopqrstuvwxyzsi代表序列代表序列s的第的第i个字符,比如个字符,比如s4=ds=abcde,序列,序列s是序列是序列s的子序列(的子序列(substring)蛋白质序列:由蛋白质序列:由2020个不同的字母(氨基酸)排列组合而成。个不同的字母(氨基酸)排列组合而成。核酸序列:由核酸序列:由4 4个不同的字母(碱基)排列组合而成。个不同的字母(碱基)排列组合而成。 (DNADNA序列,序列,RNARNA序列)序列)FASTAFASTA格式:格式: 第一行:大于号加名称或其它注释第一行:大于号加名称或其它注释 第二行以后:每行第二行以后:每行6060个字母(也有个字母(也有8080的,不一定)的,不一定)FASTAFASTA格式格式nameMHHHHHHSSGRENLYFQGKLPEPQFYAEPHTYEEPGRAGRSFTREIEASRIHIEKIIGSGDSGEVCYGRLRVPGQRDVPVAI

      2、KALKAGYTERQRRDFLSEASIMGQFDHPNIIRLEGVVTRGRLAMIVTEYMENGSLDTFLRTHDGQFTIMQLVGMLRGVGAGMRYLSDLGYVHRDLAARNVLVDSNLVCKVSDFGLSRVLEDDPDAAXTTTGGKIPIRWTAPEAIAFRTFSSASDVWSFGVVMWEVLAYGERPYWNMTNRDVISSVEEGYRLPAPMGCPHALHQLMLDCWHKDRAQRPRFSQIVSVLDALIRSPESLRATATVSFASTAFASTA格式:格式:第一行:大于号加名称或其它注释第一行:大于号加名称或其它注释第二行以后:每行第二行以后:每行6060个字母(也有个字母(也有8080的,不一定)的,不一定)在在游戏麻将泰坦游戏麻将泰坦中,你需要用眼睛从一推麻将牌中找出一对相同的麻将牌。中,你需要用眼睛从一推麻将牌中找出一对相同的麻将牌。序列相似性序列相似性 数据库中的序列相似性搜索数据库中的序列相似性搜索对于一个蛋白质或核酸序列,你需要从序列数据库中找到对于一个蛋白质或核酸序列,你需要从序列数据库中找到与它相同或相似的序列。不

      3、可能再用眼睛去比较每一对序与它相同或相似的序列。不可能再用眼睛去比较每一对序列,因为数据库中有太多序列,甚至用列,因为数据库中有太多序列,甚至用眼睛比较一对序列都是不可能做到的。眼睛比较一对序列都是不可能做到的。 BLAST序列相似性序列相似性 数据库中的序列相似性搜索数据库中的序列相似性搜索 序列相似性的重要性序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能空间结构和生物学功能 ,因此对于一个已知序列但未知结构和功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。可以推测这个未知结构和功能的蛋白质的结构和功能。相似的序列相似的序列相似的结构相似的结构 相似的功能相似的功能序列相似性序列相似性结构相似?功能相似?结构相似?功能相似? 序列相似性的重要性序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的相似

      4、的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能空间结构和生物学功能 ,因此对于一个已知序列但未知结构和功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。可以推测这个未知结构和功能的蛋白质的结构和功能。序列相似性序列相似性一致度一致度:又称同一度,又称同一度,如果两个序列(蛋白质或核酸)长度相同,如果两个序列(蛋白质或核酸)长度相同,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,氨基酸或碱基)的数目占总长度的百分数。氨基酸或碱基)的数目占总长度的百分数。相似度相似度:如果两个序列(蛋白质或核酸)长度相同,那么它们的相:如果两个序列(蛋白质或核酸)长度相同,那么它们的相似度定义为他们对应位置上相似的残基与相同的残基的数目和占总似度定义为他们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。长度的百分数。问题:哪个残基与问题:哪个残基

      5、与哪个残基算作相似哪个残基算作相似答:残基两两相似的量化答:残基两两相似的量化关系被关系被替换记分矩阵替换记分矩阵所定所定义。义。 序列一致度(序列一致度(identityidentity)与相似度()与相似度(similaritysimilarity)序列相似性序列相似性序列序列 1 : CLHK序列序列 2 : CIHL替换记分矩阵替换记分矩阵替换记分矩阵(替换记分矩阵(Substitution MatrixSubstitution Matrix):反映残基之间相互替换率的矩反映残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。分为阵,它描述了残基两两相似的量化关系。分为DNADNA替换记分矩阵和替换记分矩阵和蛋白质替换记分矩阵。蛋白质替换记分矩阵。DNADNA替换记分矩阵替换记分矩阵蛋白质替换记分矩阵蛋白质替换记分矩阵序列序列 1 : CLHK序列序列 2 : CIHL1. 1. 等价矩阵(等价矩阵(unitary matrixunitary matrix):):最简单的替换记分矩阵,其中,相同核苷酸之间的匹配得分为1,不同核苷酸间的替换得分为0。由于不含有碱基的理化信息

      6、和不区别对待不同的替换,在实际的序列比较中较少使用。2. 2. 转换转换- -颠换矩阵(颠换矩阵(transition-transversion matrixtransition-transversion matrix):):核酸的碱基按照环结构特征被划分为两类,一类是嘌呤(腺嘌呤A、鸟嘌呤G),它们有两个环;另一类是嘧啶(胞嘧啶C、胸腺嘧啶T),它们只有一个环。如果DNA碱基的替换保持环数不变,则称为转换,如A G、C T;如果环数发生变化,则称为颠换,如A C、T G等。在进化过程中,转换发生的频率远比颠换高。为了反映这一情况,通常该矩阵中转换的得分为-1,而颠换的得分为-5。3. BLAST3. BLAST矩阵:矩阵:经过大量实际比对发现,如果令被比对的两个核苷酸相同时得分为+5,反之为-4,则比对效果较好。这个矩阵广泛地被DNA序列比较所采用。 A T C G A T C GA T C GA 1 0 0 0 A 1 -5 -5 -1 A 5 -4 -4 -4 T 0 1 0 0 T -5 1 -1 -5 T -4 5 -4 -4C 0 0 1 0 C -5 -1 1 -5 C

      7、-4 -4 5 -4G 0 0 0 1 G -1 -5 -5 1 G -4 -4 -4 5 DNADNA序列的替换记分矩阵序列的替换记分矩阵 3 3种种常见的常见的DNADNA序列的替换记分矩阵序列的替换记分矩阵1. 1. 等价矩阵(等价矩阵(unitary matrixunitary matrix):):与DNA等价矩阵道理相同,相同氨基酸之间的匹配得分为1,不同氨基酸间的替换得分为0。在实际的序列比对中较少使用。2. PAM2. PAM矩阵(矩阵(DayhoffDayhoff突变数据矩阵):突变数据矩阵):PAM矩阵基于进化原理。如果两种氨基酸替换频繁,说明自然界易接受这种替换,那么这对氨基酸替换得分就应该高。PAM矩阵是目前蛋白质序列比较中最广泛使用的记分方法之一,基础的PAM-1矩阵反应的是进化产生的每一百个氨基酸平均发生一个突变的量值(统计方法得到)。PAM-1自乘n次,可以得到PAM-n ,即发生了更多次突变。3. BLOSUM3. BLOSUM矩阵(矩阵(blocks substitution matrixblocks substitution matrix):):BLO

      8、SUM矩阵都是通过对大量符合特定要求的序列计算而来的。PAM-1矩阵是基于相似度大于85%的序列计算产生的,那些进化距离较远的矩阵,如PAM-250,是通过PAM-1自乘得到的。即,BLOSUM矩阵的相似性是根据真实数据产生的,而PAM矩阵是通过矩阵自乘外推而来的。BLOSUM矩阵的编号,比如BLOSUM-80中的80,代表该矩阵是由一致度80%的序列计算而来的,同理, BLOSUM-62是指该矩阵由一致度62%的序列计算而来的。蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵 3 3种常见的种常见的蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵BLOSUM-62BLOSUM-62对角线上的数值为匹对角线上的数值为匹配氨基酸的得分;其配氨基酸的得分;其他位置上,他位置上,0 0的得分的得分代表对应氨基酸对为代表对应氨基酸对为相似氨基酸。相似氨基酸。 3 3种常见的种常见的蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵 选选 PAM-1 还是还是 PAM-250?氨基酸差异氨基酸差异 %PAMPAMBLOSUMBLOSUM-1 1PAM

      9、-1PAM-1BLOSUM -99BLOSUM -991010PAM-11PAM-11BLOSUM -90BLOSUM -902020PAM-23PAM-23BLOSUM -80BLOSUM -803030PAM-38PAM-38BLOSUM -70BLOSUM -704040PAM-56PAM-56BLOSUM -60BLOSUM -605050PAM-80PAM-80BLOSUM -50BLOSUM -506060PAM-112PAM-112BLOSUM -40BLOSUM -407070PAM-159PAM-159BLOSUM -30BLOSUM -308080PAM-246PAM-246BLOSUM -20BLOSUM -20蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵 选选 PAM-? 还是还是 BLOSUM-? BLOSUM-80 BLOSUM-62 BLOSUM-45 PAM-1 PAM-120 PAM-250亲缘关系较近的亲缘关系较近的 亲缘关系较远的亲缘关系较远的序列之间的比对序列之间的比对 序列之间的比对序列之间的比对对于关系较远的序列之间的比较,由于对于关系较

      10、远的序列之间的比较,由于PAM-250是推算而来,所以其是推算而来,所以其准确度受到一定限制,准确度受到一定限制,BLOSUM-45更具优势。对于关系较近的序列之更具优势。对于关系较近的序列之间的比较,用间的比较,用PAM或或BLOSUM矩阵做出的比对结果,差别不大。矩阵做出的比对结果,差别不大。最常用的:最常用的:BLOSUM-62蛋白质序列的替换记分矩阵蛋白质序列的替换记分矩阵1. 1. 等价矩阵(等价矩阵(unitary matrixunitary matrix)2. PAM2. PAM矩阵(矩阵(DayhoffDayhoff突变数据矩阵)突变数据矩阵)3. BLOSUM3. BLOSUM矩阵(矩阵(blocks substitution matrixblocks substitution matrix)4. 4. 遗传密码矩阵(遗传密码矩阵(genetic code matrix, GCMgenetic code matrix, GCM):):遗传密码矩阵通过计算一个氨基酸转换成另一个氨基酸所需的密码子变化的数目而得到,矩阵的值对应为据此付出的代价。如果变化一个碱基就可以使一个

      《山东大学生物信息学课件06-1序列比较1》由会员东***分享,可在线阅读,更多相关《山东大学生物信息学课件06-1序列比较1》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.