
档案检索语言4一体化课件.ppt
12页档案检索语言刘 宇 档案检索语言4一体化5检索语言的发展与应用n5.1分类主题一体化n5.2检索语言应用方式的发展n5.3自然语言在档案文献检索中的应用档案检索语言4一体化5.1分类主题一体化n1一体化发展的历史q1969年,英国,艾奇逊编制《分面叙词表》,被誉为“首次实现分类检索和主题检索两者合一的系统”q1981,侯汉清教授首次提出“分类主题一体化的可能性和必要性”q1994年,《中国分类主题词表》编制出版q1994年,国家档案局科学技术研究所成立了一个4人课题组,专门进行分类检索语言和主题检索语言一体化可行性的调查研究档案检索语言4一体化5.1分类主题一体化n2一体化的理论依据q分类法和主题法的区别分类法主题法文献集中按照学科专业集中文献按照事物的主题集中文献关系显示等级结构参照系统标识符号分类符号规范化的词语检索功能从事物的有序性和知识的系统性来认识和查找文献直接按照事物的名称进行检索档案检索语言4一体化5.1分类主题一体化n2一体化的理论依据q分类法和主题法的共性n本质上都使用了分类的基本思想:两者的区别仅在于类的排列上《中国档案主题词表》在一定程度上可以看成是《中国档案分类法》的字顺索引n基本构件本质相同:主题法和分类法皆是“立类”,主题法是“以名立类”,分类法士“以类立名”;它们类集的内容是相同的,基本上都是主题概念;它们处理对象都是语义单元,两者的差别仅在于类集的方式和采用的标识不同n分类号和主题词都是揭示文献主题内容的标识集合,功能相同q对文献的主题加以标引q问内容相同的文献加以集中或揭示相关性q对大量文献进行系统化和组织化q便于将标引用语和检索用语进行相符性比较档案检索语言4一体化5.1分类主题一体化n3一体化方法q理论方法n以分类法为主体,从主题词表中选出与类名相对应的主题词,编成一个可用的“分类号-主题词对应表”。
如使《中国档案主题词表》中的主题词都能找到想对应的类目,按照《中国档案分类法》的体系结构排列成分类号与主题词相互对应的新词表n以主题词表中的范畴索引为主体,从分类法中找到想对相应的分类号(包括类名),编成分类主题一体化检索工具;要把《中国档案分类法》中一部分非主题词性的类名转换为规范化的主题词或者使它们具有主题词功能档案检索语言4一体化5.1分类主题一体化n3一体化方法q实践成果n《民国档案分类主题词表》q以《民国档案分类表》为主体构架,从主题词表中筛选与分类表类名相同的主题词进行对应,为分类表中的类目标识找到对应的主题词,同时也为主题词表中的主题词找到了对应的分类号n河北省档案馆《中国历史档案机检分类主题词对照表》q以体系分类法为主体,以主题词为辅,用分类号搭配标识词进行标引n北京石化工业研究院将《石化工业档案分类表》和《石化工业档案主题词表》合一n中央档案馆将《革命历史档案主题词表》范畴号和《新民主主义革命分类表》的类号统一档案检索语言4一体化5.2检索语言应用方式的发展n1在计算机环境下的应用q词表、分类表的计算机编制n自动化:自动生成反参考系统、自动进行排序、自动进行格式整理q词表、分类表的计算机管理n增、删、改款目或类目更为方便q词表、分类表的机读化n联机查词,提高用词的准确性n自动换词n记录机读词表的历史沿革n进行标引词标引频次的统计n便于扩检和对检索策略进行优化档案检索语言4一体化5.2检索语言应用方式的发展n2检索语言的多语种结合应用q检索语言并用n用两种类型不同的检索语言同时标引文献n动力机械产品设计档案编目的资料:NJ16<5>(动力机械产品设计档案)+“档案编目”(《中国档案主题词表》)q语言自动转换n用一种语言标引文献,用另一种语言检索文献q条件:计算机中存储一种或多种检索语言的对应词表n语言自动转换的类型q不同检索语言之间的转换q自然语言和检索语言直接的转换档案检索语言4一体化5.3自然语言在档案文献检索中的应用n1自然语言应用的必然性q查准率高q通用性广q易用性好q词汇无滞后q便于实现自动标引n计算机从文献题名或正文中抽取出表达文献主题的词汇或短语,进行自动标引q根本原因n档案文献检索本质上是一种信息交流的过程,单纯地凭借检索语言是不够的,必须结合自然语言,才能更好的满足信息交流的要求——全、准、快、便、省档案检索语言4一体化5.3自然语言在档案文献检索中的应用n2自然语言的应用途径q作为检索语言中的入口词n建立入口字表,使用Y参照指引到标引词q作为自由词和主题词相结合用于文献标引n在使用主题词进行文献标引时,同时使用自然语言(自由词)标引同一份文档n《档案主题标引规则》中的自由词标引规则q某些概念采用主题词组配其结果出现多义q虽然某些概念可以采取靠词标引(相关词标引),但是这些概念被标引的频次很高q词表中明显漏收录的词q表达新生事物的词档案检索语言4一体化5.3自然语言在档案文献检索中的应用n2自然语言的应用途径q采用关键词法用于档案文献检索n关键词:出现在文献的题名、摘要或正文中对表征文献主题内容具有实质意义的词n标引和检索时均使用关键词q采用自由标引后控词表检索法n在标引时采用自然语言,当标引的数量达到一定量的时候,在对标引词进行规划化处理(后控),显示词之间的关系,生成后控词表n在检索词,根据后控词表进行检索n后控词表是一种只供检索用的主题词表档案检索语言4一体化。












