
信息检索原理最新课件.ppt
31页信息检索原理最新信息检索原理最新二、检索语言及其作用二、检索语言及其作用 检索语言,又称文献存储与检索语言、索引语言、标引语言等,是信息检索系统存贮与检索共同遵循的一种专用语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言简而言之,检索语言是用来描述信息源特征和进行检索的人工语言,可分为规范化语言(例如,用词表来规范)和非规范化语言(自然语言)两类 第三章 信息检索原理第三章 信息检索原理•检索语言的分类检索语言的分类 1. 1.描述文献信息外部特征的检索语言描述文献信息外部特征的检索语言 著者索引 题名索引 文献序号索引 引文索引 2.2.描述文献信息内部特征的检索语言描述文献信息内部特征的检索语言 分类检索语言 主题检索语言第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理Ø分类检索语言 分类检索语言 《《中国图书馆分类法中国图书馆分类法》》 《中图法》是一部综合性分类表,也就是说《中图法》是能够供所有学科专业文献标引和检索使用的标引语言1975年10月科学技术文献出版社正式出版《中图法》第一版,1999年3月北京图书馆出版社出版第四版,全称也从《中国图书馆图书分类法》改为《中国图书馆分类法》。
2001年夏北京图书馆出版社出版了第四版的电子版,称为《中国图书馆分类法》(第四版)电子版1.0版 《中图法》按照毛泽东毛泽东关于“什么是知识?自从有阶级的社会存在以来,世界上的知识只有两门,一门叫做生产斗争知识生产斗争知识,一门叫做阶级斗阶级斗争知识争知识自然科学自然科学就是生产斗争知识生产斗争知识的结晶、社社会科学会科学就是阶级斗争知识阶级斗争知识的结晶,哲学哲学则是关于自然知识自然知识和社会知识社会知识的概括和总结的论断,将知识门类分为“哲学”、 “社会科学”、“自然科学”三大类;马列主义、毛泽东思想、邓小平理论是指导我们事业的理论基础,故作为一个基本类;对于一些内容庞杂、类无专属,无法按某一学科内容性质分类的图书,概括为“综合性图书”,作为一个基本类第三章 信息检索原理第三章 信息检索原理 《中国图书馆分类法》(简称《中图法》)分为5大部类,22个基本大类,每个大类用一个大写字母表示,其序列如下: 第三章 信息检索原理第三章 信息检索原理马克思主义、列宁主义、毛泽东思想马克思主义、列宁主义、毛泽东思想 、邓小平理论、邓小平理论AA马克思主义、列宁主义、毛泽东思想、邓小平理论马克思主义、列宁主义、毛泽东思想、邓小平理论哲学、宗教哲学、宗教BB哲学、宗教哲学、宗教社会科学社会科学CC社会科学总论社会科学总论DD政治、法律政治、法律EE军事军事FF经济经济GG文化、科学、教育、体育文化、科学、教育、体育HH语言、文字语言、文字II文学文学JJ艺术艺术KK历史、地理历史、地理第三章 信息检索原理第三章 信息检索原理自然科学自然科学NN自然科学总论自然科学总论OO数理科学和化学数理科学和化学PP天文学、地球科学天文学、地球科学QQ生物科学生物科学RR医药、卫生医药、卫生SS农业科学农业科学TT工业技术工业技术UU交通运输交通运输VV航空、航天航空、航天XX环境科学环境科学综合性图书综合性图书ZZ综合性图书综合性图书第三章 信息检索原理第三章 信息检索原理L L、、 M M、、 W W、、 Y Y留待扩冲留待扩冲 医药、卫生大类又细分为以下二级类目:医药、卫生大类又细分为以下二级类目: R1 R1 预防医学、卫生学预防医学、卫生学R2 R2 中国医学中国医学 R3 R3 基础医学基础医学R4 R4 临床医学临床医学 R5 R5 内科学内科学R6 R6 外科学外科学 R71 R71 妇产科学妇产科学R72 R72 儿科学儿科学 R73 R73 肿瘤学肿瘤学R74 R74 神经病学与精神病学神经病学与精神病学 R75 R75 皮肤病学与性病学皮肤病学与性病学R76 R76 耳鼻咽喉科学耳鼻咽喉科学 R77 R77 眼科学眼科学R78 R78 口腔科学口腔科学 R8 R8 特种医学特种医学R9 R9 药学药学第三章 信息检索原理第三章 信息检索原理图书分类的体系结构图书分类的体系结构 ::R医药、卫生 .......................(第一级类目)R5内科学 ...............................(第二级类目)R55血液及淋巴系统疾病 .......(第三级类目)R556贫血病 ...............................(第四级类目)R556.6 溶血性贫血.........................(第五级类目)R556.6+1 先天性溶血性贫血......(第六级类目)第三章 信息检索原理第三章 信息检索原理例如: O 数理科学与化学 O1 数学 O11 古典数学 ……. O15 代数、数论、组合理论 151 代数方程式论、线性代数 151.1 代数方程式论、 151.2 线性代数第三章 信息检索原理第三章 信息检索原理Ø主题检索语言 主题检索语言 《《医学主题词表医学主题词表》》((MeSHMeSH)) 《医学主题词表》简称MeSH,是世界著名的医学主题词表,由美国国立医学图书馆(NLM)编制,用来规范医学文献的标引、编目和检索用词。
MeSH对我国医学图书馆、医学信息界的影响很大,中国医学科学院医学情报研究室早在1964年就翻译有MeSH中译本,所有需要检索与利用国内外医学文献信息资源的用户需要了解、熟悉和掌握MeSH第三章 信息检索原理第三章 信息检索原理图书馆书目检索图书馆书目检索一、基本概念一、基本概念【什么是主题】【什么是主题】 主题主题““是一组具有共性事物的总称,用以表达文是一组具有共性事物的总称,用以表达文献所论述和研究的具体对象和问题献所论述和研究的具体对象和问题””,即文献的,即文献的““中心内容中心内容””什么是主题词】【什么是主题词】 表达主题概念的词汇就是主题词表达主题概念的词汇就是主题词 狭义的主题词仅指叙词狭义的主题词仅指叙词 ;; 广义主题词可以分为规范词汇和自由词汇,包括关广义主题词可以分为规范词汇和自由词汇,包括关键词、主题词、标题词、叙词键词、主题词、标题词、叙词 【主题词的规范】【主题词的规范】 同义词(近义词)、多义词(一词多义)和相关关同义词(近义词)、多义词(一词多义)和相关关系词的规范化处理系词的规范化处理。
【主题词的作用】【主题词的作用】 主题词指能代表文献内容实质的经过严格规范主题词指能代表文献内容实质的经过严格规范化的专业名词术语或词组,因此其特点是具有唯一化的专业名词术语或词组,因此其特点是具有唯一性,多个相同概念、名词术语、同义词等在索引中性,多个相同概念、名词术语、同义词等在索引中只能用唯一一个术语表达,目地是使内容相同或相只能用唯一一个术语表达,目地是使内容相同或相近的文献更加集中、更具有专指性,避免同义词的近的文献更加集中、更具有专指性,避免同义词的多次检索多次检索关键词】【关键词】 指从文献中抽出来的、有实质内容的、未经或指从文献中抽出来的、有实质内容的、未经或略经规范化了的名词术语以及增添的相关概念词,略经规范化了的名词术语以及增添的相关概念词,它属于自然语言范畴它属于自然语言范畴 第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理 主题法字顺表:将所用主题词全部按字母顺序排列并附以各种参照和注释 分类法范畴表:将主题词及一些非主题词按其所属的学科体系和逻辑关系分类排列,并归入15大类、101个小类及约1.8万个子目类(这些子目就是供检索用的主题词)。
IM主题词下还有76个副主题词 MeSH(树状结构表)IMIM-美国《医学索引》-美国《医学索引》(Index Medicus)(Index Medicus)第三章 信息检索原理第三章 信息检索原理•MeSH MeSH 的字顺表:的字顺表:1515个大类个大类A .........解剖B .........有机体C .........疾病D .........化学品和药物E .........分析、诊断、治疗技术和设备F .........精神病学和心理学G .........生物科学H .........自然科学I .........人类学、教育,社会学和社会现象J .........工艺学、工业、农业K .........人文科学L .........情报科学M .........人群N .........卫生保健Z .........地理名称第三章 信息检索原理第三章 信息检索原理•范畴表(树状结构表)的作用:确定主题词范畴表(树状结构表)的作用:确定主题词 它是字顺表的辅助索引由于它揭示出主题词的从属派生关系,读者便可通过这种上下级关系确定恰当的主题词。
如欲知“OVARY (卵巢)” 是否是IM所用主题词,可在该表的A5类中,从广义的“泌尿生殖系统”逐级往狭义词查找即可查到第三章 信息检索原理第三章 信息检索原理树树状状体体系系结结构构MeSHMeSH第三章 信息检索原理第三章 信息检索原理 字顺表和范畴表虽形式不同但内容相通,它们分别反映主题词间学科交叉的横向联系和隶属派生的纵向关系它们相辅相成,协调配合,构成一个功能完整的检索体系 MeSHMeSH主要起规范主题词、使标引者和检索者在用词上达到尽可能的一致,它是标引和检索医学文献的依据第三章 信息检索原理第三章 信息检索原理• MeSHMeSH使用方法:选择规范化的主题词使用方法:选择规范化的主题词 用主题途径检索文献,关键是要选准主题词MeSH对一系列具有同义性(如“脑血管障碍” 与“中风”)、近义性(如“癌”与“肿瘤”)、繁称与简称之别(如“脱氧核糖核酸”与“DNA”)、学名与俗名之别(如“抗坏血酸” 与“维生素C”)的词汇进行了规范化处理,把含义相同或相近的文献集中在一规范的主题词下,使检索者有章可循 我们在确定主题词时必须遵循MeSH的用词规定,否则检索的第一步就会失败。
如查“癌症”的文献不用“Cancer” 而用“Neoplasms”,查“风疹”的文献不用“Germam measles ['mi:zlz] ” 而用“Rubella” 等检索前若不能把握自己所用主题词是否规范,可用MeSH进行核对第三章 信息检索原理第三章 信息检索原理•MeSHMeSH使用方法:使用方法:副主题词及其使用范围副主题词及其使用范围 副主题词与主题词一样均是经过规范化处理的词,它的作用就是限定主题词的外延而增加其内涵它把主题词所涉及的范围按不同的研究方向加以限定从而也就相对地增强了主题词的专指性,这样,同类文献就能相对集中,便于检索肝肿瘤—血液 肝肿瘤—膳食疗法肝肿瘤—血液供给 肝肿瘤—药物疗法肝肿瘤—脑脊髓液 肝肿瘤—经济学肝肿瘤—化学诱导 肝肿瘤—超声检查肝肿瘤—分类 肝肿瘤—死亡率肝肿瘤—并发症 肝肿瘤—护理肝肿瘤—先天性 肝肿瘤—流行病学肝肿瘤—诊断 肝肿瘤—遗传学肝肿瘤—化学 肝肿瘤—历史 以肝肿瘤为例,它可以和几十个副主题词,以肝肿瘤为例,它可以和几十个副主题词,即学科或方向进行组配,因此有着广泛的适应性。
即学科或方向进行组配,因此有着广泛的适应性第三章 信息检索原理第三章 信息检索原理肝肿瘤—寄生虫学 肝肿瘤—免疫学肝肿瘤—病理学 肝肿瘤—代谢肝肿瘤—病理生理学 肝肿瘤—微生物学肝肿瘤—预防和控制 肝肿瘤—放射性核素成像肝肿瘤—心理学 肝肿瘤—放射摄影术肝肿瘤—放射疗法 肝肿瘤—分泌肝肿瘤—胚胎学 肝肿瘤—外科学肝肿瘤—酶学 肝肿瘤—治疗肝肿瘤—病因学 肝肿瘤—超微结构肝肿瘤—康复 肝肿瘤—尿肝肿瘤—继发性 肝肿瘤—兽医学第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理第三章 信息检索原理 例如“糖尿病(Dia—betes Mellitus)”这个主题词下就有血液、并发症、诊断、饮食疗法、药物疗法、经济学、病因学、免疫学、代谢、死亡率、流行病学、病理生理学、预防与控制、心理学、治疗和尿等诸多方面的文献,如果把内容相近的文献集中到相应的副主题词下,检索者就不会费太多时间在排列无序的文献中费力查找 又如要检索“糖尿病代谢”方面的文献,检索者只需在‘糖尿病” 这个主题词下找到副主题词“代谢(Metablasm)”,便是糖尿病代谢方面的全部文献,其它则属非相关文献。
如果有些文献归不到任一副主题词下,就接隶属于某一主题词IM的主题词下有76个副主题词,它们需与主题词组配使用才能使后者具有专指意义第三章 信息检索原理第三章 信息检索原理一、图书馆目录•目录是著录一批相关文献,并按照一定次序排列而成的一种揭示与报道文献的工具•图书馆目录是通过揭示图书馆馆藏文献的内容来宣传图书,达到阅读的目的图书馆书目检索图书馆书目检索二、图书、期刊排架及查找方法 1.排架方法:排架方法:分类排架法、刊名排架法、固定排架法、代号排架法排架顺序是同一个书架上从上到下、从左到右排列 2.查找方法:查找方法:一是直接到开架书库中书架上查找;二是先利用馆藏目录查到要找图书的索书号,再根据索书号到书库中索取 分类号:分类号:据中国图书馆图书分类法据中国图书馆图书分类法 I247.5 国际标准刊号:国际标准刊号:ISBN 7-04-02161-5ISBN 7-04-02161-5 索取号:分类号索取号:分类号∕∕排架顺序号排架顺序号 图书馆书目检索图书馆书目检索三、文献检索途径 1.篇名途径6.关键词途径 2.著者途径7.分类途径 3.著者地址8.序号途径 4.刊名途径9.其它途径 5.主题词途径 图书馆书目检索图书馆书目检索图书馆书目检索图书馆书目检索检索途径:检索途径:1.1.题名题名2.2.责任者责任者3.3.主题词主题词4.4.分类号分类号5.5.ISBNISBN6.6.索取号索取号图书馆书目检索图书馆书目检索。












