
2022年信息组织辅导课程总复习.doc
34页本科《信息组织》课程总复习 第1章 概论 (一)本章学习目标 1.理解信息组织的必要性、信息组织的研究领域; 2.熟练掌握信息组织的常见类型、信息资源处理的基本方法; 3.学会区分信息组织与信息检索、检索系统的资源单元方式和标识单元方式、先组式与后组式、目录、索引、数据库的不同; 3.能运用上述理论方法理解各种信息组织系统与检索工具的组成原理 (二)本章重点要点 1.信息组织概念及其必要性; 2.信息组织与信息检索的关系(参看图1-1); 3.按标识特征区分的两种基本检索工具类型,按检索途径区分的检索工具类型; 4信息处理的基本方法 (三)本章练习题 ○名词解释 (1)信息组织:是根据信息检索的需要,对信息资源的内容特征等进行分析、选择、标引、处理,使之成为有序信息集合的过程 (2)信息检索是根据一定需要从检索系统中检出相关信息资源的过程 (3)数据是经过直接观察获得的关于客观对象的记述,是未经处理的对于事实的表述 (4)信息是经过处理的数据或人们交流的知识,是有意义的数据 (5)目录是记录、报道与揭示文献的工具,主要有目录与书目 (6)索引是揭示文献集合或文献中有检索意义的文献单元或信息内容的查询工具。
(7)检索语言是由表达信息资源主题概念及其相互关系的词汇和规则组成的人工语言 ○思考题 信息组织与信息检索有什么关系? (1)信息组织是信息检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才能准确有效查找相关信息资源; (2)信息检索则是信息组织出发点与归宿,用户的检索需要是组织信息的主要依据 信息组织有哪些职能与作用?(1)信息组织的职能:1)集中和揭示信息资源的内容特征,通过控制和处理信息,提高信息资源的价值; 2)建立信息资源系统和检索工具,便于信息资源的开发与利用; 3)信息组织使用的控制语言及各种规范是一种知识序化结构,是信息组织的语言保障和质量保障 4)信息组织能够克服现代社会信息的海量性、无序性和污染性,解决它与人们对信息需求的专业性、选择性和及时性的矛盾 (2)信息组织的作用1)信息资源组织资源描述、内容浓缩、提供检索点; 2)检索工具组织 3.按照提供的检索途径,信息组织可分为哪些类型? 题名检索工具(系统)、责任者检索工具(系统)、分类检索工具(系统)、主题检索工具(系统)、引文检索工具(系统)等 4.按照标识特征,检索工具可以分哪两种基本类型? (1)以信息资源的外部特征(形式特征)为检索依据,提供以信息资源形式特征为标识检索途径。
常见的信息资源形式特征有责任者名(即作者和与资源形成相关的人或机构,如译者、改编者、修订者等)、题名、机构名、标准书号、专利号、文献登录号(或顺序号)等 (2)以信息资源的主题内容特征为检索依据,提供从资源内容进行检索的途径,主要有分类法、主题法 5.简述信息资源处理的基本方法 (1)信息资源处理是信息组织和揭示的基础,它以处理过的信息记录作为原信息的替代物来组织信息系统; (2)信息处理的基本方法 1)描述信息资源,以便识别与确认它,主要方法是著录、编写题录和资源形式特征的描述; 2)浓缩信息资源内容,主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源; 3)提供检索点主要方法是确定特定资源的标索特征(或标识)与可检信息信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等 第2章信息组织原理 (一)本章学习目标 1.理解信息组织的基本要求和规范控制的依据; 2.熟练掌握信息组织的控制与规范方法及信息组织的特点; 3.学会信息组织的描述控制、词汇控制、句法控制方法,以及检全率、检准率的计算方法; 3.能运用信息组织控制方法对常见词汇进行规范控制。
(二)本章重点要点 1.信息组织的描述控制、词汇控制、句法控制; 2.概念的内涵与外延、概念之间的关系,概念的限制与概括、分析与综合 (三)本章练习题 `○名词解释 (1)检全率是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例,用公式表示为检全率=检出的相关信息资源量/系统中相关信息资源总量数×1% (2)检准率; 是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例用公式表示为检准率=检出的相关信息资源数/检出的信息资源总数×1% (3)联系符号:为了防止主题词之间出误组配而使用的揭示同一文献主题之间联系强度的专用符号 (4)职能符号是一种表示主题标识在组配中的句法职能而规定的辅助符号 (5)轮排转换依次把检索语句中每一个有检索意义的词轮流排列在检索位置上 (6)引用次序指复合主题标引或检索时,各个主题因素的组合次序 ○问答题 1简述对信息组织的要求 (1)检全率是指一次检索中检出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量的比例检全率是衡量检索系统检索能力和检索效率的重要指标; (2)检准率。
是指检出的相关信息资源的数量,占检出的全部信息资源数量的比例检准率是衡量检索系统排除与提问无关的的信息的能力,较高的检准率可以节省用户时间,提高系统效率 (3)检索速度和系统的及时性检索速度是指用户从实施检索到得到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数它与系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳入、处理和提供信息 (4)系统易用性是指标引人员使用检索系统描述、标引资源是否方便和易用; 用户使用系统的简易性、方便性与获取信息的容易程度系统易用性是系统性能的主要因素,决定系统设计改进和发展方向 (5)检索的成本效益是指检索系统的成本和效益之比检索成本包括系统设备费、标引处理费、检索运行费; 检索效益指检索系统创造经济效益和社会效益好的检索系统是低成本高效益的系统 2简述信息资源组织中的规范控制应包括哪些方面? (1)描述控制即对描述记录的内容、描述方进行的控制包括描述项目、描述文字、描述级别、描述格式的控制; (2)词汇控制即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程。
主要方法有同义控制、词义控制、词间关系控制; (3)句法控制即根据信息资源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的规定常用的句法措施有确定引用次序、使用辅助符号、以及句式转换(轮排转换、链式转换、分析转换) 3词汇控制的范围是什么? (1)词汇控制即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程 (2)词汇控制的主要措施包括 1)同义控制,是对字面形式不同而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达包括对同义词、准同义词及部分专指词与泛指词进行的控制同义控制常用的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立用代参照,便于用户从非规范词找到规范词同义控制的作用是可以克服一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起 2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明确,一个词语只表示一个概念,以控制一词多义现象词义控制常用的方法是在词后加限义词,在词下增加含义注释和范围注释 3)词间关系控制,是揭示词汇之间的等级、等同、相关关系,使之成为语义相关的系统在主题法中词间关系控制采用设置参照、倒置标题、主标题-副标题以及编制词汇索引系统,如词族索引、范畴索引、轮排索引等。
分类语言主要通过类目体系显示词语间的从属、并列、相关关系,用类目参照显示语词概念的横向联系 (3)词汇控制还应包括词量控制、词组选择与使用控制、词汇专指度控制等 4句法控制的方法主要有哪些? 句法控制是根据信息资源标引和检索的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定常见的句法措施有确定引用次序、使用辅助符号和句式转换 (1)引用次序,是指复合主题标引和检索时,各个主题因素的组合次序在分类法中引用次序是指类目划分标准使用的先后次序或各主题分面在组配时的先后次序; 在主题法中是指字顺检索系统中主标题与各级子标题组合的次序 (2)辅助符号,是揭示主题概念之间的关系意义、进行检索操作的符号常见的有 1)关系符号,是一种用于揭示词语组配中形成的关系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明组配性质并有一定的排序功能 2)联系符号,是一种揭示同一文献主题之间联系强度的符号,可以防止主题词之间出现误组配 3)职能符号,是一种表示主题标识在组配中的句法职能的符号,可以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义,提高检准率 (3)句式转换,是为了使检索句子各个有意义的词素能成为检索入口字,通过对语句中词语位置的变动来增加检索点。
常见的有 1)轮排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持相对位置的情况下移动 2)链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的词语依次排在检索入口 3)分析转换,在一个检索词句中,每次抽取少量的词组配成标题,依次把每个有检索意义的词排在检索位置上 5阐述文献保证原则和用户保证原则 (1)标识的数量以及类目的级别应考虑信息源的采集与情况,并与信息源的数量呈正比 (2)安排类目的次序也要考虑信息源的实际情况,如文献多的类目排在文献少的类目之前 n实施该原则的前提是必须了解文献源以及文献主题的数量情况,为此,可以采用文献调查、词汇收集、标引频率统计等手段 n(3)在选择分类标准及其引用次序,确定类目的专指度,安排标识的排列次序等方面考虑用户的使用特点 第3章信息描述 (一)本章学习目标 1.理解信息描述概念、意义与作用,以及信息描述的规范、HTML、XML的基本格式和DTD和RDF的基本概念; 2.熟练掌握基本描述项目、检索点、计算机编码中的MARC格式和DC格式; 3.学会文献描述的基本项目和计算机编码的基本方法; 4.能运用《文献著录总则》格式描述一般文献,能运用简单的HTML格式描述文件。
(二)本章重点要点 1.信息描述基本项目、描述级次; 2.检索点的选择与参照法,名称规范档的控制方法; 3.HTML、XML、DTD、RDF的格式 (三)本章练习题 ○名词解释 1.DC是都柏林元素集的简称,1995年3月在美国小镇都柏林创建的元数据描述方法 2.ISBD是《国际标准书目著录》的英文缩写,由国际图联(IFLA)1969年制定的供各类信息资源描述用的国际标准 3.XML是可扩展标记语言的简称,是W3C倡议的、在SGML基础上发展起来的新一代计算机标记语言 4.MARC是机读编目格式的简称,是根据文献特点和信息交换需要设立的标准计算机可读文档格式 5.DTD是文件类型定义的简称,原是SGML的重要组成部分,后来成为W3C 的XM。












