生物信息学:揭开生命奥秘的交叉学科
43页1、<p><p>&lt;p&gt;&amp;lt;p&amp;gt;&amp;amp;lt;p&amp;amp;gt;&amp;amp;amp;lt;p&amp;amp;amp;gt;&amp;amp;amp;amp;lt;p&amp;amp;amp;amp;gt; 揭开生命奥秘的新兴交叉学科 第七章 生物信息学 内 容 n生物信息学概念 n生物信息学的内容 n生物信息学的研究方法和技术 n生物信息学软件和数据库 一、生物信息学的概念(p199) 生物信息学是用数理 和信息科学的观点、理 论和方法,以计算机为 工具对生物信息进行收 集、加工、储存、传播 、检索和分析的科学。 研究材料和结果是各 种各样的生物学数据 n人基因组海量信息 n23对=46条染色体 n30亿碱基对(base pairs) n35万个基因?基因 组学 n3万种以上蛋白质 ? 蛋白质组学 n基因表达、作用、调 控网络 已经
2、或即将完成的生物全基因组 n几百种原核生物 n酵母菌 n拟南芥 (1-2亿bp) n水稻 n人类 (32亿bp) n小鼠 n大鼠 n猪 n鸡.等 生物信息学的概念 n后基因组时代的到来 n人类首次了解了自身的基因序列 ,了解了很多远亲生物的基因序列 n正在面对指数扩增的基因序列和 各种数据库 n面临如何将基因序列资料转变为 有用的知识,进而服务于人类,造福 人类健康的挑战 n人类功能基因组学必须多学科协 作 n生物信息学技术 n生物芯片技术 n蛋白质组学技术 n高通量细胞筛选技术等 n生物信息学是人类功能基因组学研 究的必要工具 实验 生物学 计算 生物学 理论 生物学 生物信息的开发和应用 n以核酸蛋白质等生物大分子为主要研究对象 n以信息、数理、计算机科学为主要研究手段 n以计算机网络为主要研究环境 n以计算机软件为主要研究工具 n对序列数据进行存储、管理、注释、加工 n对各种数据库进行查询、搜索、比较、分析 n构建各种类型的专用数据库信息系统 n研究开发面向生物学家的新一代计算机软件 生物信息学的概念 计算机学、 计算机网络 医学 生物学、 分子生物学 生物信息学 数学、 统计学
3、 生物信息学和其它学科的关系 生物信息学是一门边 缘学科,它位于生物 、医学、计算机、数 学等多个领域的交叉 点上 生物信息学的概念 蛋白质组学和蛋白质组学和 结构基因组学结构基因组学 高通量药物筛选高通量药物筛选药物设计和小分子设计药物设计和小分子设计创新药物和新剂型创新药物和新剂型 生物芯片生物芯片 计算机辅助药物筛选 高通量虚拟筛选方法 分子数据库,组合化 学化合物库,靶标生 物大分子的功能分析 . 蛋白质蛋白质相互 作用识别,信号传导 系统、代谢途径的分 子模拟. 图像处理、聚 类分析、表达 谱和调控网络 分析. 基因组信息基因组信息 生物信息技术生物信息技术 计算机辅助先导化合 物设计、药物设计 二、生物信息学的内容(p200) 1.基因与基因组分析 可读框预测和 基因标注 序列拼接 与组装 结果上传到数 据库 碱基读取载体标识与去除 测序仪中原始数 据的采样与分析 大规模基因序列测定 生物信息学的内容 基因预测 DNA序列中编码区的鉴定 预测方法的依据: 编码统计学:编码区序列同非编码区序列相比,有 不同的特点,存在一些非随机的特点 GC 含量 密码子偏倚性 (CODON
4、FREQUENCY) 第三个碱基组成 基因结构/统计学方法 比较/同源性 生物信息学的内容 原核生物基因结构 编码区 启动子 转录起始位点 非翻译区 转录区 起始密码子 终止密码子 53 转录终止位点 RBS 生物信息学的内容 5 启动子 转录起始位点 非翻译区 转录区 起始密码子 终止密码子 3 转录终止位点 外显子 切除和拼接位点 GT AG 内含子 真核生物基因结构真核生物基因结构 生物信息学的内容 lHMM? lHMM 描述了模型中各隐含状态的转换概率 基因组序列 ATGCGTGCAGTCACCAGCAGTCAGTCG Introns Exon 隐含状态 用于基因预测的隐马尔可夫模型 Hidden Markov Models ,HMM ATGCGTGCAGTCACCAGCAGTCAGTCG 基因组序列 生物信息学的内容 特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转换概率取决于转换信号的出现(剪切位 点) 和/或 在特定隐藏状态的碱基对平均数量 (即内含 子或外显子大小). IntronsExon P= 0.5 P= 0.8 基因组序列 ATGCGTGCAGTC
5、ACCAGCAGTCAGTCG 用于基因预测的隐马尔可夫模型 生物信息学的内容 n研究主要集中在核苷酸序列 的存储、分类、检索和分析等 方面 n新基因的发现 n非蛋白编码区生物学意义的分 析 n基因组整体功能及其调节网络 的系统把握 n基因组演化与物种演化 基因组分析 生物信息学的内容 n蛋白质结构 n新蛋白的完整、精确 和动态的三维结构 n计算机辅助结构模拟 n理解蛋白质的氨基酸序列 和三维结构之间的关系 n蛋白质序列及特性分析 n蛋白质组学 2.蛋白质与蛋白质组分析 生物信息学的内容 相当数量的蛋白质、核酸、多糖的三 维结构获得精确测定,基于生物大分 子结构知识的药物设计成为热点; 根据靶标分子与药物分子相结合的活 性部位的几何形状和化学特征,设计 出与其相匹配的具有新颖结构的药物 分子。 3 新药设计 三、生物信息学的研究方法和技术 n数学统计方法 n在分析DNA语言中的语义、分析密码子使用频率、利用马尔 可夫模型进行基因识别 n动态规划(Dynamic Programming)方法 n一种通用的优化方法:在状态空间中,根据目标函数,通过 递推,求出一条从状态起点到状态终点的最优
《生物信息学:揭开生命奥秘的交叉学科》由会员ji****72分享,可在线阅读,更多相关《生物信息学:揭开生命奥秘的交叉学科》请在金锄头文库上搜索。
2024-02-20 37页
2024-02-20 62页
2024-02-10 31页
2024-02-02 50页
2024-02-02 16页
2024-02-02 21页
2024-02-02 23页
2024-02-02 26页
2024-02-02 26页
2024-02-02 25页