电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

山东大学生物信息学课件03生物信息学数据库及检索策略

112页
  • 卖家[上传人]:东***
  • 文档编号:281333801
  • 上传时间:2022-04-23
  • 文档格式:PPT
  • 文档大小:10.78MB
  • / 112 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、NCBIBioinformatics database and retrieval strategyNCBI1.重要生物信息数据库2.生物信息数据及其格式3.数据库检索工具EntrezContentNCBINCBINCBI11、重要生物信息中心、重要生物信息中心 Bioinformatics Bioinformatics CentresCentresNCBI NCBI National Center for Biotechnology Information National Center for Biotechnology Information (US)(US) www.ncbi.nlm.nih.govwww.ncbi.nlm.nih.govEBIEBI European Bioinformatics Institute European Bioinformatics Institute (EU)(EU) www.ebi.ac.ukwww.ebi.ac.ukDDBJ DNA Data Bank of Japan DDBJ DNA Data Bank of Japan (JP)(JP

      2、) www.ddbj.nig.ac.jp www.ddbj.nig.ac.jpExPASyExPASy Expert of Protein Analysis System ( Expert of Protein Analysis System (SwitzerlandSwitzerland ) ) www.expasy.ch www.expasy.chPDB Protein Data Bank (US)PDB Protein Data Bank (US) www.rcsb.org/pdb/ www.rcsb.org/pdb/ CBIPKU CBIPKU 北京大学生物信息中心北京大学生物信息中心 (CNCN) BioSino 中国生物信息中心中国生物信息中心 (CN )(CN ) www.biosino.org www.biosino.orgNCBINCBINCBINCBINCBINCBITools for Bioinformatics ResearchTools for Bioinformatics ResearchEntrezEntrezSRSSRSNCBI数据库的集成与检索界面的统

      3、一数据库的集成与检索界面的统一XMLXMLSite ASite BData IntegrationNCBINCBISRSSRS( (S Sequence equence R Retrieval etrieval S Systemystem ) )SRSSRS是欧洲分子生物学网是欧洲分子生物学网EMBnetEMBnet的主要检索工具的主要检索工具SRS, Sequence Retrieval System, is a powerful database management system developed specifically for biological databases. The goal of SRS is to provide an efficient access to databases with biological contents no matter in what format are they available and allowing for complex search criteria.NCBI数据库记录的格式与检索路口NCBI核酸核酸/ /蛋白质数

      4、据库记录的组成蛋白质数据库记录的组成n n由于历史原因,各种生物数据库采用了由于历史原因,各种生物数据库采用了不同的信息格式不同的信息格式不同的信息格式不同的信息格式,许多,许多生物计算机软件也要求生物计算机软件也要求特定的核酸和蛋白质序列输入格式特定的核酸和蛋白质序列输入格式特定的核酸和蛋白质序列输入格式特定的核酸和蛋白质序列输入格式。n n一个数据库记录一个数据库记录(entry)(entry)一般由两部分组成:一般由两部分组成:原始序列数据原始序列数据原始序列数据原始序列数据和描和描述这些数据述这些数据生物学信息的注释生物学信息的注释生物学信息的注释生物学信息的注释(annotation)(annotation)。注释中包含的信息注释中包含的信息与相应的序列数据同样重要和有应用价值,值得注意。与相应的序列数据同样重要和有应用价值,值得注意。n n序序列列部部分分和和注注释释部部分分两两者者都都有有固固定定格格式式,以以便便计计算算机机读读取取。各各个个数数据据库库的的具具体体格格式式又又有有所所不不同同,大大致致分分成成GenBankGenBank和和和和EMBLEMBL两种风格

      5、。两种风格。NCBIGenBankGenBank Records RecordsHeaderFeature TableSequenceThe Flatfile FormatNCBIGenBankGenBank格式格式格式格式GenBankGenBank格式:格式:格式:格式:每个条目都是一份每个条目都是一份纯文本文件纯文本文件纯文本文件纯文本文件。每行左端为空格或为识别字,。每行左端为空格或为识别字,识别字均为识别字均为完整英文字完整英文字完整英文字完整英文字,不用缩写。,不用缩写。 格式可以分成格式可以分成3 3个部分:个部分:1 1)头部包含关于整个序列的信息(描述字符),从头部包含关于整个序列的信息(描述字符),从头部包含关于整个序列的信息(描述字符),从头部包含关于整个序列的信息(描述字符),从 LOCUSLOCUS行到行到行到行到ORIGINORIGIN行行行行;2 2)注释这一序列的特性()注释这一序列的特性()注释这一序列的特性()注释这一序列的特性(Feature TableFeature Table),为注释核心部分;),为注释核心部分;),为注释核心部分;),为注释

      6、核心部分;3 3)序列本身序列本身序列本身序列本身(Sequence)(Sequence)。注:所有的核苷酸数据库记录(注:所有的核苷酸数据库记录(EMBL/EMBL/GenBankGenBank/DDBJ)/DDBJ)都在最都在最后一行以后一行以/ /结尾。结尾。NCBIGenBank格式格式NCBIEMBLEMBL格式格式格式格式EMBLEMBL格式:格式:格式:格式:欧洲分子生物学欧洲分子生物学EMBLEMBL数据库的每个条目是一份数据库的每个条目是一份纯文本文件纯文本文件纯文本文件纯文本文件,每一行最前面是由每一行最前面是由两个大写字母组成两个大写字母组成两个大写字母组成两个大写字母组成的识别标志,常见的识的识别标志,常见的识别标志列举在后面的表中。识别标志别标志列举在后面的表中。识别标志“ “特性表特性表” ”FTFT包含一批包含一批关键字,它们的定义已经与关键字,它们的定义已经与GenBankGenBank和和DDBJDDBJ统一。下欧洲国统一。下欧洲国家的许多数据库如家的许多数据库如SWISS-PROTSWISS-PROT、ENZYMEENZYME、TRANSFACTRA

      7、NSFAC等,等,都采用与都采用与EMBLEMBL一致的格式。一致的格式。 NCBIEMBL格式格式NCBI数据库记录注释代码和内容说明数据库记录注释代码和内容说明 EMBLEMBL识别标志识别标志 GenBankGenBank识别字识别字 意义意义ID ID LOCUS LOCUS 序列名称序列名称DEDEDEFINITIONDEFINITION序列简单说明序列简单说明AC AC ACCESSION ACCESSION 唯一的提取号唯一的提取号OSOSSOURCESOURCE序列来源的物种名序列来源的物种名OC OC ORGANISM ORGANISM 序列来源的物种学名和分类学位置序列来源的物种学名和分类学位置DT DT 建立日期建立日期 KW KW KEYWORDSKEYWORDS与序列相关的关键词与序列相关的关键词RNRNREFERENCEREFERENCE相关文献编号,或递交序列的注册信息相关文献编号,或递交序列的注册信息RARAAUTHORSAUTHORS相关文献作者,或递交序列的作者相关文献作者,或递交序列的作者RTRTTITLETITLE相关文献题目相关文献题目RLRL

      8、JOURNALJOURNAL引文出处引文出处相关文献刊物杂志名,或递交序列的作者单位相关文献刊物杂志名,或递交序列的作者单位RXRXMEDLINE MEDLINE 相关文献相关文献MedlineMedline引文代码引文代码RPRP相关文献其它注释相关文献其它注释p18NCBI数据库记录注释代码和内容说明(数据库记录注释代码和内容说明(cont.cont.)EMBLEMBL识别标志识别标志 GenBankGenBank识别字识别字 意义意义RCRCREMARKREMARK相关文献注释相关文献注释DRDR相关数据库交叉引用号相关数据库交叉引用号XXXX为阅读清晰而加的空行为阅读清晰而加的空行 CC CC COMMENT COMMENT 评注评注 NI NI VERSION VERSION 可更新的序列版本号可更新的序列版本号 FH FH FEATURES FEATURES 序列特征表起始序列特征表起始FT FT FEATURES FEATURES 特性表特性表 SQ SQ EMBLEMBL序列开始标志,后随长度、字母数序列开始标志,后随长度、字母数 BASE COUNT BASE COU

      9、NT GenBankGenBank碱基数目碱基数目 ORIGIN ORIGIN GenBankGenBank序列开始标志,该行空序列开始标志,该行空 / / / / 序列结束标志,空行序列结束标志,空行 p18NCBILOCUS AF062069 3808 bp mRNA INV 02-MAR-2000序列序列序列序列和和和和数据库标识数据库标识数据库标识数据库标识位置位置, , 提取号提取号, , 版本版本 Definition accession versionDefinition accession versionDEFINITION Limulus polyphemus myosin III mRNA, complete cds.GB DivisionLocus名字简单描述 (标题)修改日期序列类型mRNA (= cDNA)rRNAsnRNADNA序列长度VERSION AF062069.2 GI:7144484ACCESSION AF062069提取号Accession.versiongi number最古老的甲壳动物最古老的甲壳动物鲎(鲎(hu)肌球蛋白肌球蛋白IIINCB

      10、I关关键字,生物体来源键字,生物体来源 Keywords and sourceKeywords and sourceKEYWORDS .SOURCE Atlantic horseshoe crab. ORGANISM Limulus polyphemus Eukaryota; Metazoa; Arthropoda; Chelicerata; Merostomata; Xiphosura; Limulidae; Limulus.序列来源的物种名序列来源的物种名序列来源的物种学名和序列来源的物种学名和分类学位置分类学位置可更新的序可更新的序列版本号列版本号后生动物后生动物 NCBIREFERENCE 1 (bases 1 to 3808) AUTHORS Battelle,B.-A., Andrews,A.W., Calman,B.G., Sellers,J.R., Greenberg,R.M. and Smith,W.C. TITLE A myosin III from Limulus eyes is a clock-regulated phosphoprotein JOURNAL J

      《山东大学生物信息学课件03生物信息学数据库及检索策略》由会员东***分享,可在线阅读,更多相关《山东大学生物信息学课件03生物信息学数据库及检索策略》请在金锄头文库上搜索。

      点击阅读更多内容
    TA的资源
    点击查看更多
    最新标签
    信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.