好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

我眼中的生物信息学.doc

4页
  • 卖家[上传人]:飞***
  • 文档编号:18378712
  • 上传时间:2017-11-14
  • 文档格式:DOC
  • 文档大小:19KB
  • / 4 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 我对生物信息学的认识学院 生科院班级 1304姓名 周飘飘学号 191306062一、生物信息学的概念从广义上来说,生物信息学从事对基因组研究相关生物信息的获取、加工、储存、分配、分析和解释包括了两层含义,一是对海量数据的收集、整理与服务,也就是管好这些数据;另一个是从中发现新的规律,也就是用好这些数据从狭义上来说,生物信息学是把基因组 DNA 序列信息分析作为源头,找到基因组序列中代表蛋白质和 RNA 基因的编码区;同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在 DNA 序列中的遗传语文规律;在此基础上,归纳、整理与基因组遗传语文信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律二、生物信息学的主要研究方向1、序列比对序列比对的基本问题是比较两个或两个以上符号序列的相似性或不相似性从生物学的初衷来看,这一问题包含了以下几个意义:从相互重叠的序列片断中重构 DNA 的完整序列在各种试验条件下从探测数据中决定物理和基因图遍历和比较数据库中的 DNA 序列比较两个或多个序列的相似性在数据库中搜索相关序列和子序列寻找核苷酸的连续产生模式找出蛋白质和 DNA 序列中的信息成分序列比对考虑了 DNA 序列的生物学特性,如序列局部发生的插入,删除和替代,序列的目标函数获得序列之间突变集最小距离加权和或最大相似性和,对齐的方法包括全局对齐,局部对齐,代沟惩罚等。

      两个序列比对常采用动态规划算法,这种算法在序列长度较小时适用,然而对于海量基因序列,这一方法就不太适用,甚至采用算法复杂性为线性的也难以奏效因此,启发式方法的引入势在必然,著名的 BALST 和 FASTA 算法及相应的改进方法均是从此前提出发的 2、蛋白质结构比对和预测基本问题是比较两个或两个以上蛋白质分子空间结构的相似性或不相似性蛋白质的结构与功能是密切相关的,一般认为,具有相似功能的蛋白质结构一般相似蛋白质是由氨基酸组成的长链,长度从 50 到 1000~3000AA,蛋白质具有多种功能,如酶,物质的存贮和运输,信号传递,抗体等等氨基酸的序列内在的决定了蛋白质的 3 维结构一般认为,蛋白质有四级不同的结构直接对蛋白质结构进行比对的原因是由于蛋白质的 3 维结构比其一级结构在进化中更稳定的保留,同时也包含了较 AA 序列更多的信息蛋白质 3 维结构研究的前提假设是内在的氨基酸序列与 3 维结构一一对应观察和总结已知结构的蛋白质结构规律出发来预测未知蛋白质的结构同源建模和指认方法属于这一范畴同源建模用于寻找具有高度相似性的蛋白质结构(超过 30%氨基酸相同) ,后者则用于比较进化族中不同的蛋白质结构。

      然而,蛋白结构预测研究现状还远远不能满足实际需要 3、基因识别非编码区分析研究基因识别的基本问题是给定基组序列后正确识别基因的范围和在基因组序列中的精确位置非编码区由内含子组成,一般在形成蛋白质后被丢弃,但从实验中,如果去除非编码区,又不能完成基因的复制显然,DNA 序列作为一种遗传语言,既包含在编码区,又隐含在非编码序列中分析非编码区 DNA序列目前没有一般性的指导方法在人类基因组中,并非所有的序列均被编码,即是某种蛋白质的模板,已完成编码部分仅占人类基因总序列的 3~5%4、分子进化和比较基因组学分子进化是利用不同物种中同一基因序列的异同来研究生物的进化,构建进化树既可以用 DNA 序列也可以用其编码的氨基酸序列来做,甚至于可通过相关蛋白质的结构比对来研究分子进化,其前提假定是相似种族在基因上具有相似性通过比较可以在基因组层面上发现哪些是不同种族中共同的,哪些是不同的早期研究方法常采用外在的因素,如大小,肤色,肢体的数量等等作为进化的依据近年来较多模式生物基因组测序任务的完成,人们可从整个基因组的角度来研究分子进化在匹配不同种族的基因时,一般须处理三种情况:Orthologous:不同种族,相同功能的基因; Paralogous:相同种族,不同功能的基因;Xenologs:有机体间采用其他方式传递的基因,如被病毒注入的基因。

      这一领域常采用的方法是构造进化树,通过基于特征和基于距离的方法和一些传统的聚类方法来实现 5、序列重叠群装配根据现行的测序技术,每次反应只能测出 500 或更多一些碱基对的序列,如人类基因的测量就采用了短枪方法,这就要求把大量的较短的序列全体构成了重叠群逐步把它们拼接起来形成序列更长的重叠群,直至得到完整序列的过程称为重叠群装配从算法层次来看,序列的重叠群是一个 NP-完全问题 6、遗传密码的起源通常对遗传密码的研究认为,密码子与氨基酸之间的关系是生物进化历史上一次偶然的事件而造成的,并被固定在现代生物的共同祖先里,一直延续至今不同于这种"冻结" 理论,有人曾分别提出过选择优化,化学和历史等三种学说来解释遗传密码随着各种生物基因组测序任务的完成,为研究遗传密码的起源和检验上述理论的真伪提供了新的素材 7、基于结构的药物设计人类基因工程的目的之一是要了解人体内约 10 万种蛋白质的结构,功能,相互作用以及与各种人类疾病之间的关系,寻求各种治疗和预防方法,包括药物治疗基于生物大分子结构及小分子结构的药物设计是生物信息学中的极为重要的研究领域为了抑制某些酶或蛋白质的活性,在已知其蛋白质 3 级结构的基础上,可以利用分子对齐算法,在计算机上设计抑制剂分子,作为候选药物。

      这一领域目的是发现新的基因药物,有着巨大的经济效益三、生物信息学得意义生物信息学的研究对人们认识和改造生物体有着重大的作用人类的发展是人类信息不断传递的过程生物信息学的研究,让人们了解了生物的构造,推理出了生物遗传信息的传递过程,在个体和分子研究领域上发挥着重大的作用,推动这人类文明的进步和时代的发展。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.