
文献检索中常用检索运算符.doc
4页1) 逻辑算符 逻辑算符(logical operator), 也称布尔算符(Boolean operator),用来表示两个检索词之间的逻辑关系,常用的有三种:逻辑与(and) 、逻辑或(or)和逻辑非(not)这里用A和B分别代表两个检索词,它们的逻辑关系由下表和图说明 如果一个检索式中包含若干逻辑关系,则其执行优先顺序为: NOT, AND, OR,最可靠的办法是将需先执行的部分放在括号内 三种逻辑关系(阴影部分为命中) (2) 位置算符 位置算符(proximation operator),表示其连接的两个检索词之间的位置关系,常用的有(W), (nW), (N), (nN), (L), (S), (F)等 (W)与(nW)算符 W是with的缩写W)或用( )表示其连接的两个检索词必须按序出现,中间不允许插词,只能有一空格或标点、符号 如:high(W)class 命中的记录中出现的匹配词可能有:high class 或high-class (nW)与(W)类似, 只是它允许插词,插词量小于或等于n个 如:silicon(1W)sensor 命中的记录中出现的匹配词除silicon sensor外,还可能有:silicon integrated sensor, silicon image sensor, silicon-based sensor等。
如:silicon(2W)sensor 命中的记录中出现的匹配词除上例的外,还可能会有:silicon angular rate sensor, silicon-based chemical sensor等等 (N)与(nN)算符 N是near的缩写N)表示其连接的两个检索词的顺序可以互易,但两词间不允许插词nN)中的n表示允许插词量少于或等于n个 如:internet(N)accessing 命中记录中出现的匹配词可能有: internet accessing, accessing internet 如:internet(1N)accessing 命中记录中除上例的外,还会可能有:accessing internet, accessing the internet, internet /intranet accessing等 (S)算符 S是Subfield的缩写S)表示其连接的两个检索词必须出现在同一子字段中子字段是指字段中的一部分,如一句句子,一个词组、短语字段不限,词序不限 如:silicon(S)sensor 命中记录出现的匹配情况如: A vacuum magnetic sensor(VMS) using a silicon field emitter tip was fabricated and demonstrated. (F)算符 F是Field 的缩写。
F)表示其连接的两个检索词必须出现在同一字段中,字段不限,词序不限 以上所有算符的书写用大小写均可算符执行的优先顺序是按检词之间的关系紧密程度确定的,越紧的关系越先执行一般将需要先执行的部分可放在括号内 不同算符的比较 两个词由不同的算符组成不同的检索式,其检索结果显然不同,也就是说检索策略的变化将影响检索的结果比如同样两个词用关系较紧的算符其检索结果中的记录一定比用关系较松的来得少以下用electron和device 两词为例,在Dialog 8号文档Ei Compendex数据库检索,其结果如表下所示 除了"逻辑非"和"逻辑与"不能确定外,这些算符按关系的松紧排序,其检索结果、命中记录的数量也是有序的3) 截词符 截词符(truncation operator),也称统配符(wild card), 用来对检索词(干)进行扩展在Dialog系统中用 ? 号表示号加在不完整的词或词干之后,或是插在一个词的中间来表示词后或词中可添加的随机字符其作用是减少检索词的输入而保证相关检索概念的涵盖,同时也方便解决语言文字拼写方面的差异(如美式英语和英式英语),避免漏检截词有:非限定性截词、限定性截词和中间截词等。
非限定性截词 截词符(truncation operator),是在一个词尾加一个 ? 号,表示在其后可添加任意多个字符,这些字符都被作为检索词进行检索 如:smok?将对若干词进行检索,包括:smoke, smoky, smoked, smoker, smokes, smokers, smoking, smokeless等等 限定性截词 限定性截词(limited truncation), 是在一个词尾加有限个 ?号,n个 ?号表示其后可添加的字符数少于等于n个 如:smok??将对smoke, smoky, smoked, smoker, smokes等进行检索对于最多允许添加一个字符的情况, 则用 ? ? 的形式表示 如;smok? ?将只对 smoke, smoky进行检索 中间截词 中间截词(embedded truncation), 是在一词中间出现若干个?号,表示可插入若干个字符 如:ioni?ation将对ionisation和ionization进行检索 如:cent??line将对centerline和centreline进行检索。












