山东大学生物信息学课件06序列比较
185页1、生生 物物 信信 息息 学学序列比较序列比较 1 1认识序列认识序列序列(序列(sequence)就是个字符串()就是个字符串(string)。)。s=abcdefghijklmnopqrstuvwxyzsi代表序列代表序列s的第的第i个字符,比如个字符,比如s4=ds=abcde,序列,序列s是序列是序列s的子序列(的子序列(substring)蛋白质序列:由蛋白质序列:由2020个不同的字母(氨基酸)排列组合而成。个不同的字母(氨基酸)排列组合而成。核酸序列:由核酸序列:由4 4个不同的字母(碱基)排列组合而成。个不同的字母(碱基)排列组合而成。 (DNADNA序列,序列,RNARNA序列)序列)FASTAFASTA格式:格式: 第一行:大于号加名称或其它注释第一行:大于号加名称或其它注释 第二行以后:每行第二行以后:每行6060个字母(也有个字母(也有8080的,不一定)的,不一定)FASTAFASTA格式格式nameMHHHHHHSSGRENLYFQGKLPEPQFYAEPHTYEEPGRAGRSFTREIEASRIHIEKIIGSGDSGEVCYGRLRVPGQRDVPVAI
2、KALKAGYTERQRRDFLSEASIMGQFDHPNIIRLEGVVTRGRLAMIVTEYMENGSLDTFLRTHDGQFTIMQLVGMLRGVGAGMRYLSDLGYVHRDLAARNVLVDSNLVCKVSDFGLSRVLEDDPDAAXTTTGGKIPIRWTAPEAIAFRTFSSASDVWSFGVVMWEVLAYGERPYWNMTNRDVISSVEEGYRLPAPMGCPHALHQLMLDCWHKDRAQRPRFSQIVSVLDALIRSPESLRATATVSFASTAFASTA格式:格式:第一行:大于号加名称或其它注释第一行:大于号加名称或其它注释第二行以后:每行第二行以后:每行6060个字母(也有个字母(也有8080的,不一定)的,不一定)在在游戏麻将泰坦游戏麻将泰坦中,你需要用眼睛从一推麻将牌中找出一对相同的麻将牌。中,你需要用眼睛从一推麻将牌中找出一对相同的麻将牌。序列相似性序列相似性 数据库中的序列相似性搜索数据库中的序列相似性搜索对于一个蛋白质或核酸序列,你需要从序列数据库中找到对于一个蛋白质或核酸序列,你需要从序列数据库中找到与它相同或相似的序列。不
3、可能再用眼睛去比较每一对序与它相同或相似的序列。不可能再用眼睛去比较每一对序列,因为数据库中有太多序列,甚至用列,因为数据库中有太多序列,甚至用眼睛比较一对序列都是不可能做到的。眼睛比较一对序列都是不可能做到的。 BLAST序列相似性序列相似性 数据库中的序列相似性搜索数据库中的序列相似性搜索 序列相似性的重要性序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能空间结构和生物学功能 ,因此对于一个已知序列但未知结构和功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。可以推测这个未知结构和功能的蛋白质的结构和功能。相似的序列相似的序列相似的结构相似的结构 相似的功能相似的功能序列相似性序列相似性结构相似?功能相似?结构相似?功能相似? 序列相似性的重要性序列相似性的重要性相似的序列往往起源于一个共同的祖先序列。它们很可能有相似的相似
4、的序列往往起源于一个共同的祖先序列。它们很可能有相似的空间结构和生物学功能空间结构和生物学功能 ,因此对于一个已知序列但未知结构和功能,因此对于一个已知序列但未知结构和功能的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则的蛋白质,如果与它序列相似的某些蛋白质的结构和功能已知,则可以推测这个未知结构和功能的蛋白质的结构和功能。可以推测这个未知结构和功能的蛋白质的结构和功能。序列相似性序列相似性一致度一致度:又称同一度,又称同一度,如果两个序列(蛋白质或核酸)长度相同,如果两个序列(蛋白质或核酸)长度相同,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,那么它们的一致度定义为他们对应位置上相同的残基(一个字母,氨基酸或碱基)的数目占总长度的百分数。氨基酸或碱基)的数目占总长度的百分数。相似度相似度:如果两个序列(蛋白质或核酸)长度相同,那么它们的相:如果两个序列(蛋白质或核酸)长度相同,那么它们的相似度定义为他们对应位置上相似的残基与相同的残基的数目和占总似度定义为他们对应位置上相似的残基与相同的残基的数目和占总长度的百分数。长度的百分数。问题:哪个残基与问题:哪个残基
5、与哪个残基算作相似哪个残基算作相似答:残基两两相似的量化答:残基两两相似的量化关系被关系被替换记分矩阵替换记分矩阵所定所定义。义。 序列一致度(序列一致度(identityidentity)与相似度()与相似度(similaritysimilarity)序列相似性序列相似性序列序列 1 : CLHK序列序列 2 : CIHL替换记分矩阵替换记分矩阵替换记分矩阵(替换记分矩阵(Substitution MatrixSubstitution Matrix):反映残基之间相互替换率的矩反映残基之间相互替换率的矩阵,它描述了残基两两相似的量化关系。分为阵,它描述了残基两两相似的量化关系。分为DNADNA替换记分矩阵和替换记分矩阵和蛋白质替换记分矩阵。蛋白质替换记分矩阵。DNADNA替换记分矩阵替换记分矩阵蛋白质替换记分矩阵蛋白质替换记分矩阵序列序列 1 : CLHK序列序列 2 : CIHL1. 1. 等价矩阵(等价矩阵(unitary matrixunitary matrix):):最简单的替换记分矩阵,其中,相同核苷酸之间的匹配得分为1,不同核苷酸间的替换得分为0。由于不含有碱基的理化信息
《山东大学生物信息学课件06序列比较》由会员东***分享,可在线阅读,更多相关《山东大学生物信息学课件06序列比较》请在金锄头文库上搜索。
幼儿园大班科学活动《智能留言机》课件
幼儿园大班语言绘本阅读《手电筒看见了什么》PPT
幼儿园小班科学《教宝宝认识动物》课件
幼儿园中班语言《灰狼家的小饭桶们》教案
【国家审计报告】审计报告W-06审计处罚决定书
【企业财务管理办法】会计档案管理办法
【员工主动离职-风险防范】劳动争议判决书
【员工被动离职-后续工作】70-070员工违反有关商业秘密的约定可以索赔吗
【员工被动离职-辞退申请】第六节 员工任免通知书
【员工被动离职-后续工作】70-050因员工的原因使服务期无法完成可以索赔吗
企业岗位管理制度12办公室行为规范
企业岗位管理制度30离职人员薪资发放通知单
幼儿园春游活动美丽的公园教案
呼职院电力机车制动机讲义11高速列车和重载列车制动
武理工《运输管理》教案第1章 运输系统
中海大海洋化学讲义02海洋的形成和海水的组成——兼论地球上水的起源、变迁和循环
武理工船舶柴油机习题库及答案04燃油喷射和燃烧
厦大海洋生态学课件07海洋初级生产力
华北理工水声学课件05声波在目标上的反射和散射-1目标强度及常见声纳目标的目标强度的一般特征
武理工船舶结构与设备课件02船体结构与管系-4专用船特殊船体结构特点
2022-05-19 9页
2022-05-04 48页
2022-05-04 24页
2022-04-23 112页
2022-04-23 60页
2022-04-23 48页
2022-04-21 39页
2022-04-21 49页
2022-04-21 13页