好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

利用OMIM数据库获得遗传病诊断ppt课件.ppt

93页
  • 卖家[上传人]:des****85
  • 文档编号:293602165
  • 上传时间:2022-05-17
  • 文档格式:PPT
  • 文档大小:4.33MB
  • / 93 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章第八章 生物信息学资源检索生物信息学资源检索 胡德华胡德华2目录目录第一节第一节 生物信息学数据库概述生物信息学数据库概述 1第二节第二节 核酸序列数据库核酸序列数据库 2第三节第三节 蛋白质数据库蛋白质数据库 3第四节第四节 基因组数据库基因组数据库4第五节第五节 疾病基因数据库疾病基因数据库 53第一节第一节 生物信息学数据库概述生物信息学数据库概述一一生物信息学数据库的类型生物信息学数据库的类型 二二生物信息数据收集与存贮生物信息数据收集与存贮 三三生物信息学数据库的查找生物信息学数据库的查找4一、生物信息学数据库的类型文献数据库文献数据库 突变数据库突变数据库 图谱数据库图谱数据库 结构数据库结构数据库 序列数据库序列数据库 类型类型按收录信息内容分按收录信息内容分 5二、生物信息数据收集与存贮二、生物信息数据收集与存贮 (一)生物信(一)生物信息数据的收集息数据的收集 生物信息数据生物信息数据收集与存贮收集与存贮 (二)生物信(二)生物信息数据的存贮息数据的存贮 6(一)生物信息数据的收集(一)生物信息数据的收集 数据库与数据库合作数据库与测序中心合作数据库与期刊合作 建库的初期 4数据交换数据交换 3成批发送成批发送 2直接发送直接发送 1人工收集人工收集 7(二)生物信息数据的存贮1记录格式主要有:EMBL格式、GenBank格式存贮格式存贮格式2序列格式 又称Pearson格式 三、生物信息学数据库的查找三、生物信息学数据库的查找 v(一)通过搜索引擎查找(一)通过搜索引擎查找 v(二)通过专门的生物信息学数据库目录查询(二)通过专门的生物信息学数据库目录查询从2000年开始,Nucleic Acids Research 设立了一个数据库目录(http:/www.oxfordjournals.org/nar/database/c/)。

      v(三)通过生物信息学中心资源导航查询(三)通过生物信息学中心资源导航查询一些著名的生物信息学中心不仅自己建立和维护大量的生物信息数据库,而且一般在网上提供资源导航 9第二节第二节 核酸序列数据库核酸序列数据库一一GenBank 二二EMBL-Bank 三三DDBJ10(一)GenBank概述 一、一、GenBank(二)GenBank检索 (一)GenBank概述v是由美国国家生物技术信息中心是由美国国家生物技术信息中心(NCBI)管理管理和维护大型、综合性的公共核酸序列数据库,和维护大型、综合性的公共核酸序列数据库,包括所有已知的核酸序列和蛋白质序列,以及包括所有已知的核酸序列和蛋白质序列,以及与它们相关的文献和生物学注释与它们相关的文献和生物学注释 v网址:网址: http:/www.ncbi.nlm.nih.gov/Genbank/index.html12国际核酸序列数据库协作体国际核酸序列数据库协作体 INSDCINSDC DDBJDDBJ EMBLEMBL GenBankGenBank (一)GenBank概述vGenBank的数据来源于约的数据来源于约260000个物种,每月新增个物种,每月新增1700多个物种。

      大约多个物种大约12%的序列来自于人类,其中的序列来自于人类,其中8%是人类的是人类的EST序列v每条每条GenBank数据记录包含对序列的简要描述、它的科数据记录包含对序列的简要描述、它的科学命名、物种分类名称、参考文献、序列特征表以及序列学命名、物种分类名称、参考文献、序列特征表以及序列本身v序列特征表里包含对序列生物学特征注释,如编码区、转序列特征表里包含对序列生物学特征注释,如编码区、转录单元、重复区域、突变位点或修饰位点等录单元、重复区域、突变位点或修饰位点等v所有数据记录被划分成若干个子库,如细菌类(所有数据记录被划分成若干个子库,如细菌类(BCT)、)、病毒类(病毒类(VRL)、灵长类()、灵长类(PRI)、啮齿类()、啮齿类(ROD)以)以及及EST数据、基因组序列数据(数据、基因组序列数据(GSS)、高通量基因组)、高通量基因组序列数据(序列数据(HTG)等)等19类,其中类,其中EST数据等又被分成若数据等又被分成若干子库 (二)(二)GenBank检索检索 vEntrez是是NCBI生物信息学数据库集成检索系统,生物信息学数据库集成检索系统,可以检索以下生物信息学数据库。

      可以检索以下生物信息学数据库 v例如,查找例如,查找H1N1流感病毒(流感病毒(H1N1 Flu Virus)的核酸序列其检索步骤是:)的核酸序列其检索步骤是: (1)进入)进入Entrez主页(主页(http:/www.ncbi.nlm.nih.gov/gquery/),在),在提问框输入提问框输入H1N1 Flu Virus (2)点击)点击“GO”,得到各个数据库的检索结果得到各个数据库的检索结果3)点击)点击“Nucleotide: Core subset of nucleotide sequence records”,得到,得到GenBank核酸序列数据库中的核酸序列数据库中的4801条记录简要格式(条记录简要格式(Summary)4)点击记录的标题,即可获取该记录的详细信息点击记录的标题,即可获取该记录的详细信息20(一)EMBL-Bank概述 二、二、 EMBL-Bank (二)EMBL-Bank检索 (一)EMBL-Bank概述vEMBL-Bank(http:/www.ebi.ac.uk/embl/)是是国际三大核酸序列数据库之一,创建于国际三大核酸序列数据库之一,创建于1982年。

      年现由欧洲生物信息学研究所现由欧洲生物信息学研究所(EBI)管理和维护,管理和维护,主要收集欧洲产生的核酸序列数据主要收集欧洲产生的核酸序列数据v到到2009年年8月,月,EMBL-Bank(101版)的核版)的核酸序列达到酸序列达到163656234条,碱基数达到条,碱基数达到283748816763个v对于每条核酸序列,相关信息包括序列名称、序对于每条核酸序列,相关信息包括序列名称、序列、染色体定位、关键字、来源生物体、参考文列、染色体定位、关键字、来源生物体、参考文献、注释、序列中具有重要生物学意义的位点等献、注释、序列中具有重要生物学意义的位点等二)EMBL-Bank检索v获取获取EMBL-Bank的核酸序列数据主要是通过的核酸序列数据主要是通过SRS(Sequence Retrieval System)序列)序列检索系统检索系统v由由Lion Bioscience公司继续开发,而成为一个公司继续开发,而成为一个商业软件,科研单位只要与它签订协议即可获得商业软件,科研单位只要与它签订协议即可获得该软件的免费使用权该软件的免费使用权 vSRS是一个开放式的,可以根据需要安装不同的是一个开放式的,可以根据需要安装不同的数据库。

      数据库 SRS查询方法查询方法 v通过通过EBI的的SRS服务器服务器(http:/srs.ebi.ac.uk)进入)进入Quick Search界面v点击点击“Library Page”,即数据库选择页即数据库选择页v选择好要检索的数据库后,选择好要检索的数据库后,SRS提供三种查询方提供三种查询方式 (1)Quick Search (快速查询快速查询) (2)Standard Query(标准查询标准查询) (3)Extended Query(扩展查询扩展查询) (1)Quick Search(快速查询快速查询)(2)Standard Query(标准查询)(3)Extended Query(扩展查询)标准查询后的结果CS116935的详细信息29(一)DDBJ概述 三、三、DDBJ(二)DDBJ检索 (一)(一)DDBJ概述概述 vDDBJ (DNA Data Bank of Japan,日本核酸数据,日本核酸数据库,库,http:/www.ddbj.nig.ac.jp/index-e.html)创建于创建于1986,现由日本国家遗传学研究所的生,现由日本国家遗传学研究所的生物信息中心(物信息中心(CIB/DDBJ)管理和维护。

      管理和维护v截止至截止至2009年年9月,月,DDBJ(79版)共收录版)共收录108,593,519条序列条序列, 106,684,379,504个碱基vDDBJ 主页除了提供主页除了提供SRS、ARSA、TXSearch 、BLAST等数据检索功能外,还提供等数据检索功能外,还提供SAKURA、MSS、Sequin数据提交工具和数据提交工具和CLUSTAL W、FASTA、BLAST等数据分析工具等数据分析工具 (二)DDBJ检索v通过通过getentry、ARSA、SRS、TXSearch、BLAST、PSI-BLAST、FASTA、SSEARCH等检索工具可以获取等检索工具可以获取DDBJ数据v前四种用于检索前四种用于检索DDBJ数据库中的原始数据,其数据库中的原始数据,其中中getentry属于存取号检索,属于存取号检索,SRS和和ARSA属属于关键词检索,于关键词检索,TXSearch属于分类检索;属于分类检索;v后后4种对用户提供的序列或片断作同源性分析种对用户提供的序列或片断作同源性分析 32第三节第三节 蛋白质数据库蛋白质数据库 一一蛋白质序列数据库蛋白质序列数据库 二二蛋白质结构数据库蛋白质结构数据库 三三蛋白质功能数据库蛋白质功能数据库33一、蛋白质序列数据库一、蛋白质序列数据库 (三)(三)TrEMBL (四)(四)GenPept (二)(二)SWISS-PROT (一)(一)PIR (五)(五)UniProt (六)(六)OWL (一)(一)PIR v创创建于建于1984年。

      年 v1988年,美国年,美国NBRF、日本国、日本国际际蛋白蛋白质质信息数据信息数据库库(Japan International Protein Information Database, JIPID)与)与德国的慕尼黑蛋白德国的慕尼黑蛋白质质序列信息中心(序列信息中心(Munich Information Center for Protein Sequences, MIPS)合作成立国)合作成立国际际蛋白蛋白质质序序列信息中心(列信息中心(PIR-International)v第第75.03版的版的PIR数据数据库库按照数据的性按照数据的性质质和注和注释详释详略分成四个子略分成四个子库库:PIR1、PIR2、PIR3和和PIR4PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加检验,也未加注释;PIR4包括其他渠道获得的序列,既未验证,也无注释v网址:网址:http:/pir.georgetown.edu/PIR主主页页(二)(二)SWISS-PROTv创建于创建于1986年年v由瑞士生物信息学研究所(由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,SIB)和欧洲生物信息研究所)和欧洲生物信息研究所(EBI)共同维护和管理。

      共同维护和管理 v1994年,年,SIB创建蛋白质专家分析系统创建蛋白质专家分析系统(Expert Protein Analysis System,ExPASy) (http:/www.expasy.Ch),除了开发、维护和管理,除了开发、维护和管理SWISS-PROT数据库外,还提供蛋白质序列、结构、数据库外,还提供蛋白质序列、结构、功能和蛋白质功能和蛋白质2D-PAGE图谱等蛋白质信息资源图谱等蛋白质信息资源v到到2009年年10月,月,SWISS-PROT(57.11版)收录了版)收录了512994条序列,包含条序列,包含180531504个氨基酸个氨基酸v网址:网址:http:/expasy.org/sprot/ (三)(。

      点击阅读更多内容
      相关文档
      高等学校学生手册.doc 2025年区教育系统招聘编外教师储备人才事业单位考试押题.docx 2025年秋季青岛版三年级数学上册认识轴对称现象教学课件.pptx 2025年秋季青岛版三年级数学上册用乘法估算解决问题教学课件.pptx 2025年秋季青岛版三年级数学上册两、三位数乘一位数的笔算(不进位)教学课件.pptx 2025年秋季青岛版三年级数学上册1200张纸有多厚教学设计范文.docx 2025年秋季青岛版三年级数学上册多位数除以一位数教学课件.pptx 2025年秋季青岛版三年级数学上册认识平移、旋转现象教学课件.pptx 2025年秋季青岛版三年级数学上册多位数乘一位数教学设计范本.docx 2025年秋季青岛版三年级数学上册认识平移与旋转教学设计范文.docx 2025年秋季青岛版三年级数学上册乘数中间有0或末尾有0的乘法教学课件.pptx 2025年秋季青岛版三年级数学上册两位数乘一位数的笔算(进位)教学课件.pptx 2025年秋季青岛版三年级数学上册《两、三位数乘一位数的笔算(不进位)》教学设计与意图.docx 2025年秋季青岛版三年级数学上册我学会了吗教学课件.pptx 2025年连云港市妇幼保健院招聘专业技术人员考试笔试试题.docx 2025年深圳市大鹏新区发展和财政局招聘考试笔试试卷.docx 2025年绵阳市梓潼县财政投资评审中心招聘考试试题.docx 2025年来宾市妇幼保健院招聘考试笔试试题.docx 2025年无极县教育系统招聘教师考试笔试试卷.docx 2025年灵山县第三中学调配教师考试笔试试题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.