好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

关键词或词组为基础的数据库检索(i).ppt

41页
  • 卖家[上传人]:shaoy****1971
  • 文档编号:112209095
  • 上传时间:2019-11-05
  • 文档格式:PPT
  • 文档大小:2.32MB
  • / 41 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第三章 关键词或词组为基础的 数据库检索(I) 生物信息学 检索数据库的方法 u 用关键词或词组进行数据库检索 (Text-based database searching) u 用核苷酸或蛋白质序列进行数据库检索 (Sequence-based database searching) Gene name Author Accession number … Database 关键词或词组为基础的数据库检索 关键词 名词、描述性词、词组 序列注册号 (Accession number) 检索体系 NCBI Entrez Sequence Retrieval System (SRS) Integrated database retrieval system (DBGET) Trends in Biotechnology 1998, 16 (supplement 1):3- 5. 最准确可靠 检索须知(1) u 连接词 AND, OR, NOT(Boolean operators) rice AND enzyme (AND为缺省值,可略去) rice AND enzyme NOT kinase retrotransposon OR retroelement 注意事项: 1、AND, OR, NOT must be entered in UPPERCASE 2、Boolean operators are processed in a left-to-right sequence rice AND (microarray OR expression profile) rice AND microarray OR expression profile 3、The order can be changed by enclosing individual concepts in parentheses (processed first) PubMed 27000 records 504 records u 用引号将两个单词组成一个词组 •16S rRNA = 16S AND rRNA •“16S rRNA” pseudopod* =pseudopod OR pseudopodia OR pseudopodium 检索须知(2) Nucleotide 16S rRNA “16S rRNA”~380000 sequences ~3300000 sequences exact match u wild card, *, 放在单词后使检索范围扩大,但 专一性降低 u 表示范围, :, 连接前后关键词,限定范围 110:500[Sequence Length] 2009/3/1:2009/9/30[Publication Date] 1. Entrez http://www.ncbi.nlm.nih.gov/gquery/ NCBI 的检索体系 优点:三种检索体系中最容易操作的体系,帮助 文档完备 Entrez Help Entrez可对6大类40个数据库进行检索 Nucleic Acids Research 2013, 41:D8-D20 Entrez可对6大类40个数据库进行检索 针对基因组已测序完成的物种 针对GenBank中具有大于7万条EST的物种 Prokaryotic, chloroplast, mitochondrial, virus, protist, plant 针对17个广泛研究的模式生物 Entrez系统中数据库之间的连接 NCBI主页选择“All Databases”或Entrez主页 ,输入关键词 各个数据库中检索到的信息数量 点击相应数据库查看信息目录, 每一条信息与其它数据库的相关 信息链接 检索方法(1):跨库检索 (cross-database search) 检索方法(2):选择数据库检索 NCBI主页选择数据库,输入关键词 检索到的信息目录,每一条信息 与其它数据库的相关信息链接 查看信息内容 序列数据库的搜索——精简搜索结果 查询insulin基因的序列 不是想要的结果!如何精简? 精简搜索结果的方法1:使用Limits 查询人(human)的insulin基因的序列 关键词 [查询范围]: insulin [title] human [organism] 精简搜索结果的方法2:使用Advanced search 如何定义查询范围? LOCUS DQ176424 1980 bp DNA linear PLN 12-MAR-2006 DEFINITION Oryza sativa (indica cultivar-group) pathogen-induced defense- responsive protein 8 (DR8) gene, complete cds. ACCESSION DQ176424 VERSION DQ176424.1 GI:73918052 KEYWORDS HTG. SOURCE Oryza sativa Indica Group ORGANISM Oryza sativa Indica Group Eukaryota; Viridiplantae; Streptophyta; Embryophyta;Tracheophyta; Spermatophyta; Magnoliophyta; Liliopsida; Poales; Poaceae; BEP clade; Ehrhartoideae; Oryzeae; Oryza. REFERENCE 1 (bases 1 to 1980) AUTHORS Wang,G., Ding,X., Yuan,M., Qiu,D., Li,X., Xu,C. and Wang,S. TITLE Dual function of rice OsDR8 gene in disease resistance and thiamine accumulation JOURNAL Plant Mol. Biol. 60 (3), 437-449 (2006) PUBMED 16514565 gbdiv_pln[Properties] [Title] [Modification Date] 1000:2000[Sequence Length] [Accession] [GI] 任意搜索范围:Xa21[All Fields] biomol_genomic[Properties] biomol_mrna: mRNA biomol crna: cRNA [Publication Date] :记录记录公开日期 [Keyword]: EST GSS HTG HTC TPA TSA [Organism] [Author] [Journal] 注意:关键词和字段名(field)均不区分大小写 ORIGIN 1 ggtacattat atattctgtt tggaatatga tcaggcctag tgggaactgc tttaagttta 61 cttattcgag ctgagttagg acaacctggg gccctattag gggatgatca attatataat 121 gttattgtta cagcacacgc ttttgtaata atttttttct tagttatacc tataatgatc FEATURES Location/Qualifiers source 1646 /organism=“Dicathais orbita“ /organelle=“mitochondrion“ /mol_type=“mRNA“ /db_xref=“taxon:69583“ /clone=“20006E09“ /note=“mitochondrial and ribosomal sequences produced by suppressive subtractive hybridization“ CDS 646 /gene=“COXI“ /codon_start=1 /transl_table=5 /product=“cytochrome oxidase subunit I“ /protein_id=“ACT34372.1“ /db_xref=“GI:253740054“ /translation=“GTLYILFGMWSGLVGTALSLLIRAELGQPGALLGDDQLYNVIVT AHAFVMIFFLVMPMMIGGFGNWLVPLMLGAPDMAFPRLNNMSFWLLPPALLLLLSSAA 第四章讲讲述使用序列进进行检检索 [Feature Key]: promoter, mRNA, CDS, exon, intron, polyA_signal COXI[Gene Name] gene_in_mitochondrion[Properties] 如何定义查询范围? human[ORGN] AND 50[SLEN]:60[SLEN] AND 1999[MDAT] 精简搜索结果 Aim: Find all human nucleotide sequences with the poly(A) signal. 不同数据库的Search fields不同,详见Limits/Advanced选项! j mol evol[JOUR] AND drosophila[ORGN] “polyA_signal“[FKEY] AND human[ORGN] Aim: Find all human protein sequences with lengths between 50 and 60 amino acids that were entered into the database during 1999. Aim: Find Drosophila population studies published in the Journal of Molecular Evolution Search Field Descriptions for Sequence Database 查询人insulin基因的RefSeq序列 精简搜索结果的方法3:直接输入搜索字段 自动将俗名转换为学名 查询人insulin基因的RefSeq序列 精简搜索结果的方法4:组合多次搜索结果 使用Clipboard临时收集多条序列 永久保存收集的序列需要注册,然后Send to Collections 第三章 关键词或词组为基础的 数据库检索(II) 生物信息学 文献数据库Pubmed的搜索 http://www.ncbi.nlm.nih.gov/PubMed/ u美国国家医学图书馆的数据库 u数据来源 ü MEDLINE:已经规范处理的数据,已标注MeSH Terms,记录标有[pubmed-indexed for medline] ü In Process Citations:尚未经规范处理的数据,记录 标有[pubmed-in process] ü Publisher-Supplied Citations:由出版商提供的电子 文献,记录标有[PubMed-as supplied by Publisher] ü 搜索结果举例 Pubmed自动将检索词翻译为MeSH词汇 使用MeSH词汇能获得更加全面、准确的结果 精简PubMed搜索结果的方法:使用Advanced PubMed数据库的搜索 12 “huazhong agricultural university“[Affiliation] PubMed数据库的字段: Affiliation [AD] Article Identifier [AID] All Fields [ALL] Author [AU] Book [b。

      点击阅读更多内容
      相关文档
      Unit2 Health and Fitness语法课件-(高教版2023·基础模块2).pptx 九年级数学提升精品讲义 用配方法求解一元二次方程(原卷版).docx 九年级数学提升精品讲义 一元二次方程的根与系数的关系(解析版).docx 2025学年九年级化学优学讲练(人教版) 化学实验与科学探究(解析版).docx 九年级数学提升精品讲义 一元一次不等式与一元一次不等式组(原卷版).docx 九年级数学提升精品讲义 因式分解(解析版).docx 九年级数学提升精品讲义 相似三角形的性质(原卷版).docx 2025年 初中七年级数学 相交线与平行线 知识突破速记与巧练(原卷版).docx 九年级数学提升精品讲义 中点模型之斜边中线、中点四边形(解析版).docx 2025学年九年级化学优学讲练(人教版) 分子和原子(解析版).docx 九年级数学提升精品讲义 正方形的性质(原卷版).docx 九年级数学提升精品讲义 用因式分解法求解一元二次方程(解析版).docx 2025年 初中七年级数学 实数 知识突破速记与巧练(原卷版).docx 九年级数学提升精品讲义 应用一元二次方程(原卷版) (2).docx 2025年 初中七年级数学 相交线与平行线 压轴专练速记与巧练(解析版).docx 九年级数学提升精品讲义 用公式法求解一元二次方程(解析版).docx 2025学年九年级化学优学讲练(人教版) 化学方程式的书写(原卷版).docx 九年级数学提升精品讲义 应用一元二次方程(解析版) (2).docx 2025年 初中七年级数学 数据的收集、整理与描述 综合测试速记与巧练(解析版).docx 九年级数学提升精品讲义 中点模型之斜边中线、中点四边形(原卷版).docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.