
文献检索策略构建.ppt
43页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,文献检索策略的构建,一、检索策略的构建,检索策略,是根据检索课题的具体要求而制定的一套具体、合理的检索方案正确制定检索策略,优化检索过程,有助于取得最佳的检索效果检索策略的制定是否合理,以及在检索过程中能否根据实际情况随时修改原有的策略,使之,更加完善,都会直接影响检索结果分析检索课题,明确检索目的,选择检索方式和数据库,确定检索途径与检索标识,编制检索提问式,执行检索式,浏览检出文献,评价检索结果 调整检索策略,输出检索结果 转录、复印等,Yes,No,(一)分析研究课题,明确检索目的,分析研究课题的目的在于,明确检索内容,和,具体要求,为此,应对课题的背景、以知条件、,以及要解决的问题及要求等进行认真分析,明,确所需文献的,范围,、,类型,、,文种,、,时间,、,空间,、,输出方式,等二)选择检索方式与数据库,1、检索方式(机检)的选择,1)脱机检索,2),联机检索,3)光盘检索,4),网络检索,2、数据库的选择,数据库,是指在计算机存储设备上按一定,方式存储的相互关联的数据集合选择数据库时,要,充分考虑到:,学科专业范围是否适用;,收录的文献资料是否齐全;,揭示的,文献特征,是否准确和深入;,报道时间是否迅速;,使用的语种是否熟悉。
等等1)数据库的类型,文献型数据库,书目型数据库(题录、文摘),全文型数据库,事实型数据库(PDQ等),数值型数据库(GenBANK,PTECS等),图像型数据库,混合型数据库,2)数据库的结构,数据库的基本结构主要由,文档,、,记录,、,字段,三个层次构成文档(File),数据库可以由一至多个文档构成文档按其编排结构和功能的不同,可分为顺排文档(Sequential file)和倒排文档(Inverted file)顺排文档,是若干个记录构成的信息集,合在书目型数据库中,它以文献记录作,为信息存储单元,按记录入藏的顺序号从,小到大排列它相当于印刷型检索工具的正文部分倒,排文档,是从顺排文档记录中抽取出,的、以每一个文献特征标识作为信息存储,单元,按一定顺序排列,并在每一个标识,后注明相应的文献记录顺序号不同的文,献特征标识的组合就构成了不同类型的倒,排文档如著者倒排文档等它相当于印刷型检索工具的辅助索引,部分记录(Record),记录,是构成数据库的一个完整的信息单元,由若干个字段构成每条记录都描述了与原始信息有关的各种特征,这些特征(字段)为判定检索结果是否符合检索需要提供了依据书目型数据库中的一条记录相当于一篇完整的文献;其他类型数据库中的记录则是某种信息单元,如一组理化指数、一种治疗方案等。
下面是MEDLARS系统中的MEDLINE数据库的,一条文献记录:,AU,GINGRASS DJ;MESSER RJ,TI,-A SIMPLIFIED THCHNIQUE OF INFEIOR BORDER,AB,THE INFERIOR BORDER WIRE,AS ORIGINALLY,LA,-ENG,MH,-*BONE WIRES;HUMAN;MANDIBLE/*SURGERY,AD,DEPARTMENT OF ORAL MAXILLOFACIAL SURGERY,MEDICAL COLLEGE OF WISCONSIN,MILWAUKEE.,SO,-ORAL SURG ORAL MED ORAL PATHOL 2002;81(4):264,字段(Field),字段,是构成记录的基本信息单元(数据项),是对原,始信息的具体属性进行描述的结果书目型数据库中的字,段是描述文献内外特征的各项标识内容,如标题字段、著,者字段、文摘字段等每个字段都有各自的,字段标识符(field tag),,以供,识别其所表达的文献特征,例如:标题字段的标识符为,TI、著者字段的标识符为AU等等字段标识符也参与构建检索策略。
检索系统数据库文档记录字段,(三)确定检索标识与检索途径,确定检索途径取决于两方面的条件:一是待查课题的已知条件和检索内容的要求;二是使用的检索工具(数据库)所揭示的文献各种特征是否准确和深入不同学科、不同类型的检索工具采用不同的,文献特征,来标引文献,形成不同的,检索标识,而提供不同的检索途径1、文献检索语言(检索标识),文献检索语言(Document language,是来描述,文献特征和表达检索提问的专门语言,即根据检,索需要而创建的统一文献标引用语和检索用语的,一种人工语言检索语言既是汇集、组织、存储文献标准,,也是检索提问时所利用的手段及工具1)文献检索语言主要类型:,描述文献外表特征语言,书刊题名,著者姓名,文献序号,描述文献内容特征语言,分类语言,主题语言(主题词、关键词等),代码语言,2)检索词典,(Retrieval thesaurus),检索词典,是文献标引用语和检索用语的语源,和依据性文本它是对各学科中的名词术语、概念、代码、,分类号等进行规范化的记录,起着对检索语言规,范控制作用常见的检索词典是各种分类表和主题词表例如:,中国图书馆分类法,和,医学主题词表,(MeSH)/Thesaurus,。
2、检索途径,(1)著者途径,这是利用已知,著者姓名,(,团体机构名称,),作,为检索标识进行查检文献的一种途径它适用于,了解国内外某著者或团体机构所发,表的文献内容及其所研究课题的最新进展情况使用著者途径检索文献的,关键在于,熟悉著者,姓名在索引中的编排规则如姓名顺序、音译、排序),(2)分类途径,这是利用检索工具所采用的特定分类体系中,的,分类号,或,分类类目,作为检索标识进行查检文献,的一种途径它能较好地满足按类检索文献的要求,,适用,于,按学科概念检索文献使用分类途径检索文献的,关键在于,熟悉检索,工具所采用的特定分类法3)主题途径,这是根据能反映文献主要内容的主题(包括,主题词,和,关键词等,)作为检索标识进行查检文献,的一种途径它具有较强的专指性和直接性的特点,,适用,于,查找内容比较具体、专一的文献使用主题途径检索文献的,关键在于,能够选准,代表所需文献主题内容的检索词选用主题词时应注意的问题:,1.选用主题词,应从事物的“专有名词”来考虑,不要从“过,程词”来考虑如“肾结石的诊断”“肾结石/诊断”,2.选用主题词的概念要恰如其分,不能太广或太狭3.利用MeSH表或T,hesaurus,将非主题词转换成可供检索使,用的正式主题词。
包括同义词、近义词、简称与繁称和,俗名与学名等例如:cancer neoplasms,怀孕 妊娠、子宫纤维瘤 子宫平滑肌瘤,4、要注意主题词的倒置形式过敏性休克 休克,过敏性,5.主题概念的分析与转换,隐性主题分析,“为乳腺癌服务的工作组织”“癌监护组织”,“办公室吸烟对他人有害”“吸烟污染”,主题,概念分解转换,“胃十二指肠溃疡”,应转换成“胃溃疡”和“十二指肠溃疡”两个主题词,注意英文同义词(解剖名词)的主题词,胃 gastric,stomach、心 heart,cardio-,眼 eye,ocul-,ophathalm-、肝 liver,hepat-,6.没有相应主题词时,可采用靠词或上位词检索,靠词检索:“上消化道出血”“胃肠出血”;,“红细胞存活”“红细胞衰老”,上位词检索:“污水处理”“废弃物处理,液体”,7.可使用副主题词与主题词进行组配,“肝疾病的早期治疗”“肝疾病/治疗”,8.要注意主题词与副主题词组配范围的限定,肺/诊断,肺炎/诊断,9.,已有先组的主题词,不用组配,“维生素A缺乏症”“维生素A缺乏症”,,“,维生素,A,/缺乏症,”,10.不能越级组配,“胆囊炎的B超诊断”“胆囊炎/超声检查”,“,胆囊炎/诊断,”,举例:“加压素治疗休克引起冠心病”,显性主题:,休克/药物治疗、加压素/临床应用、,冠心病/化学诱导,隐性主题:,加压素/副作用,(四)编辑检索提问式,*,检索提问式,是用户向检索系统表达文献需求,的句式。
检索提问式有简单提问式和复合提问式后者含有两个或两个以上的检索词,表达多维概念,的检索,要用,检索运算符号,相连接检索系统中常用的检索运算符号有以下几种:,1布尔逻辑运算符,用来表达检索词之间或检索词与检索式之间,的逻辑运算关系,这种概念组配是检索系统使用,最为广泛的检索技术常见的布尔逻辑运算符有“,逻辑与,”、“,逻辑或,”和“,逻,辑非,”3种,其符号分别为“,and,”、“,or,”和“,not,”(有的数据,库则分别用“*”、“+”和“-”或“and not”来表示)它们的逻,辑运算关系如下图所示:,A,A,A,B,B,A,B,A and B,逻辑与,A or B,逻辑或,A not B,逻辑非,1)“逻辑与”运算,这是具有,概念交叉关系或限定关系,的一种组,配它要求检索出的文献记录必须同时含有检索,词A和检索词B例如:“吸烟与肺癌的关系”,检索式为:,吸烟,and,肺癌,smoking,and,lung-neoplasms,“逻辑与”的作用是,缩小了检索范围,,,提高查准,率,2)“逻辑或“运算,这是具有,概念并列关系,的一种组配它要求,检索出的文献记录中含有检索词A,或者含有检索,词B,或者同时含有二者均为命中文献。
例如:“食欲亢进与过度饮食”,检索式为:,食欲亢进,or,过度饮食,hyperphagia,or,overeating,“逻辑或“的作用是,扩大了检索范围,,,提高查全率,3)“逻辑非“运算,这是具有,概念排除关系,的一种组配它要求检索出的,文献记录是在检索词A的记录中去掉含有检索词B的记录,,即排除了不希望出现的文献记录例如:“非儿童性白血病”,检索式为:,白血病not儿童,“逻辑非“的作用是,缩小了检索范围,,,提高查准率,使用逻辑非运算符号须慎重,容易造成漏检因为它,会把那些同时出现在检索词A和检索词B的记录排除在外在一个复合检索提问式中,各种布尔逻辑运算符是,按照,notandor,的次序运算也可用()来改变运算,次序,以符合检索课题的逻辑关系例如:“用青霉素或红霉素治疗非儿童性肺炎”,检索提问式,应为:,#1 青霉素,or,红霉素,#2 肺炎,not,儿童,#3#1,and,#2,或者:,#1(青霉素,or,红霉素),and,(肺炎,not,儿童),2位置算符,位置算符,是要求原始记录中检索词之间要满足某些,条件而使用的符号例如:检索式为,A with B,,则表示检索词A和检索词B,必须同时出现在同一记录中的,同一字段内,;,检索式为,A near B,,则表示检索词A和检索词B必须同,时出现在同一记录中的,同一句子内,。
等等位置算符提高检索结果的准确性,它比“逻辑与”更专,指,是调整检索策略的一种重要手段3,字段限制符,字段限定符,是限制检索词在数据库记录中的,特定字段范围内,检索的一种符号常见的字段,限定符有“,in,”或“,”字段限定检索的表达形式是:“,检索词in字段,标记符,”或者是“,字段标识符检索词,”例如:hepatitis in ti、张志 in au、la=English等,字段限定检索也是,缩小检索范围、提高查准率的一种方式4.,截词符,截词(Truncation),检索是利用截词符附加,在所截取检索词的局部进行检索的一种技术它,具有将同一词干的词全部查出的功能,,,扩大检索,范围,,,提高查全率,按截词的位置,截词检索有前截断、中截断、,后截断、前后截断四种方式,最常用的是,后截断,检索,不同的检索系统有不同的截词符,常用的截,词符有“,?,”和“,”是有限截词符(即“?”的数量就是替代被屏蔽字,符的数量),如输入“leukemi?”,可检索出含leukemia、leukem。












