好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

文献检索(信息检索技术-11.8.29).ppt

29页
  • 卖家[上传人]:博****1
  • 文档编号:604382441
  • 上传时间:2025-05-19
  • 文档格式:PPT
  • 文档大小:231KB
  • / 29 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,/29,*,文献检索,文献检索,电子科学与工程学院,高福斌,检索技术部分,1,/29,文献检索,第二部分 计算机信息检索技术,2.1 布尔逻辑检索(Boolean Logic),2.2 位置检索(Position Search),2.3 截词检索(Truncation),2.4 字段限定检索(Field Limiting),2.5 短语检索(Phrase Search),2.6 自然语言检索(Natural Language Search),2,/29,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(1)逻辑“与”算符:用 AND 或,*,表示;A概念和B概念的“与”关系表示为:A AND B A and B A*B,A AND B,A,B,3,/29,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(2)逻辑“或”算符:用 OR 或,+,表示;A概念和B概念的“或”关系表示为:A OR B A or B A+B,A OR B,A,B,4,/29,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(3)逻辑“非”算符:用 NOT 或,-,表示;A概念和B概念的“非”关系表示为:A NOT B A not B A-B,A NOT B,A,B,5,/29,2.1 布尔逻辑检索(Boolean Logic),第二部分 计算机信息检索技术,文献检索,(4)运算符的优先级运算,顺序如下:()NOTANDOR。

      A OR B)AND C,A,B,C,例如:(,激光器,OR,调制器,)AND,制备方法,,,先进行括号内的检索,然后再将其,检索结果,与制备方法组配,目的是检索激光器或者调制器的制备方法6,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,也叫邻近检索(Proximity Search),定义:位置算符检索是用一些特定的算符(位置算符)来表达检索词与检索词之间的邻近关系目的:用于确定词语的相对,次序,或,位置,举例:,computer,aided,design,顺序,间隔,7,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(1)(W)With(W)表示该算符两侧的检索词相邻,且两者之间只允许有一个空格或标点符号,不允许有任何字母或词,顺序不能颠倒W)也可以简写为(),检 索 式:,information()retrieval,检索结果:,information retrieval,检 索 式:,computer()aided()design,检索结果:,computer aided design,8,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(2)(nW)nWords(nW)表示在此算符两侧的检索词之间,最多,允许间隔n个词(实词或虚词),且两者的相对位置不能颠倒。

      检 索 式:laser(1W)printer,检索结果:,laser printer,laser,color,printer,9,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(3)(N)Near(N)表示该算符两侧的检索词相邻,但两者的相对位置可以颠倒检 索 式:,computer(N)network,检索结果:,computer,network,network,computer,10,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(4)(nN)nNear(nN)表示此算符两侧的检索词之间允许间隔,最多,n个词,且两者的顺序可以颠倒检 索 式:computer(,2N,)system,检索结果:,computer system,computer,code,system,computer,aided design,system,system,using modern,computer,11,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(5)(S)Subfield(S)表示其两侧的检索词必须是在文献记录的同一子字段中,而不限定它们在该子字段中的相对次序和相对位置的距离。

      在文摘字段中,一个句子就是一个子字段检 索 式:,computer()control(S)system,检索结果:“This paper is concerned with an application of the,computer,control,technique in a intelligent,system,for testing inner walls of pipes.”,12,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,美国DIALOG检索系统的,位置算符,的用法:,(6)(F)Field(F)表示其两侧的检索词必须是在文献记录的同一字段中,而它们在该字段中的,相对次序,和,相对位置,的距离,不限,例如:water()pollution(F)control,表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来13,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,Ei Village检索系统中的位置算符(只有一种):,(N)Near (N)表示两个检索词彼此接近且两词之间最多不超过,5个词,,前后顺序不限。

      例如:water()pollution(F)control,表示在同一个字段中(如篇名、文摘、叙词等)同时含有 water pollution 和 control的文献记录均可检索出来14,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,CSA Illumina,检索系统中的位置算符:,词间无算符,,即表示将检索词作为一个词组来检索,;,WITHIN“x”,,表示在指定的半径内,(x,个词,),查找输,入词,词序不限;,NEAR,设定在相距不大于,10,个词的范围内查找输,入词,相当于,within 10,;,BEFORE,按照输,入检索词相应的顺序查找;,AFTER,按照第,1,个词在第,2,个词之后的相应顺序查找15,/29,2.2 位置检索(Position Search),第二部分 计算机信息检索技术,文献检索,IEL检索系统中的位置算符:,paragraph,表示算符两边的检索词必须出现在同一段落内,两个检索词的顺序可以前后颠倒;,sentence,,表示算符两边的检索词必须出现在同一句子内,两个检索词的顺序可以前后颠倒;,,表示算符两边的检索词必须出现在同一短语内,两个检索词的顺序可以前后颠倒;,,表示两个检索词相邻,中间相隔最多,n,个词,两个检索词的顺序可以前后颠倒,。

      16,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索是计算机检索系统中应用非常普遍的一种技术由于西文的构词特性,在检索中经常会遇到,名词的单复数形式不一致,;同一个意思的词,,英美拼法不一致,;词干加上不同性质的,前缀和后缀,就可以,派生,出许多意义相近的词等为了保证查全,就得在检索式中加上这些具有各种变化形式的相关意义的检索词,这样就会出现检索式过于冗长,输入检索词的时间太久,同时也占太多机时17,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,截词检索就是为了解决这个问题而设计的,它既可保证不漏检,又可节约输入检索式的时间所谓截词,就是指在检索词的适当位置截断,保留相同的部分,用相应的截词符代替可变化部分,计算机会将所有含有相同字符部分词的记录全部检索出来18,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式1)后方截词,后方截词,也称前方一致它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。

      后方截词又分为,词尾的有限截断,和,词尾的无限截断,两种情况19,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,美国Dialog系统用“?”表示截词符,有以下几种截词方式1)后方截词,词尾的有限截断相同字符串后可能变化一个字符时,则在其后使用一个“?”、,空格,、再加一个“?”,,常用来表示检索词的单复数变化,例如用system?可以查出system和systems的文献相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符例如,?表示两个字符,?表示三个字符,以此类推20,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,词尾的无限截断相同字符串后可能变化任何字符串时,则在其后使用一个“?”这种方法可以查找出含有相同字符串的所有检索词例如,comput?可查出 compute,computer,computing,computation,computerisation等21,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,(2)中间截词,中间截词又称中间屏蔽,是一种用截词符屏蔽词中不同字符的方法。

      例如“woman”和“women”,可用“wom?n”代替;“defence”和“defense”可用“defen?e代替截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时常用的截词符有?”、“,*,”,,、“”、“”等多种表示形式,不同的检索系统其截词符的表示形式和截词检索的方式是不同的,,22,/29,2.3 截词检索(Truncation),第二部分 计算机信息检索技术,文献检索,例如:输入optic*,可检索出optic,optics,optical等;,“,?,”用于词中表示可以代替一个字符,,例如,输入wom?n可检索出woman,women.,Ei Village,中的截词符为:,“,*,”用于词中或词后表示可以代替多个字符,检索出相同词干的任意多个变化的词:,23,/29,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,字段限定检索,是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法在检索系统中,数据库设置的可供检索的字段通常有两种:,表达文献主题内容特征,的基本索引字段和,表达文献外部特征,的辅助索引字段。

      基本索引字段,包括篇名、文摘、叙词、自由标引词四个字段;,辅助索引字段,包括除基本索引字段以外的所有字段,像著者字段、著者机构字段、文献类型字段、语种字段等每个字段都有用,2个字母,表示的字段标识符(或称字段代码)24,/29,2.4 字段限定检索(Field Limiting),第二部分 计算机信息检索技术,文献检索,在,DIALOG,检索系统的命令检索模式中,使用字段限制检索时,基本索。

      点击阅读更多内容
      相关文档
      【全国硕士研究生入学统一考试政治】2020年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2015年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2010年考研政治真题.docx 【全国硕士研究生入学统一考试政治】1996年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2001年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2016年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2000年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2007年考研政治真题.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2004年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2003年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2019年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2009年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2001年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2021年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2014年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2018年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2008年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2011年考研政治真题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.