
信息组织辅导课程总复习.docx
30页信息组织课程总复习本科《信息组织》课程总复习第1章概论(一)本章学习目标1.理 解信息组织的必要性、信息组织的研究领域; 2.熟练掌握信息组织 的常见类型、信息资源处理的基本方法; 3.学会区分信息组织与信 息检索、检索系统的资源单元方式和标识单元方式、先组式与后组式、目 录、索引、数据库的不同; 3.能运用上述理论方法理解各种信息组织系统与检索工具的组成原理二) 本章重点要点1.信息组织概念及其必要性; 2.信息组织与信息检索的关系(参看图1-1); 3.按标识特征区分的两种基本检索工具类型,按检索途径区分的检索工具类型; 4信息处理的基 本方法三) 本章练习题名词解释(1)信息组织:是根据信息检索的需要, 对信息资源的内容特征等进行分析、选择、标引、处理,使之成为有序信 息集合的过程2) 信息检索:是根据一定需要从检索系统中检出相关信息资源的 过程3) 数据:是经过直接观察获得的关于客观对象的记述,是未经处 理的对于事实的表述4) 信息:是经过处理的数据或人们交流的知识,是有意义的数据6)索引:是揭示文献集合或文献中有检索意义的文献单元或信息 内容的查询工具7)检索语言:是由表达信息资源主题概念及其相互关系的词汇和 规则组成的人工语言。
O思考题1.信息组织与信息检索有什么关系? (1)信息组织是信息 检索的基础和前提,只有对信息资源进行处理和有序化信息系统之后,才 能准确有效查找相关信息资源;(2)信息检索则是信息组织出发点与 归宿,用户的检索需要是组织信息的主要依据4)信息组织能够克服现代社会信息的海量性、无序性和污染性,解决 它与人们对信息需求的专业性、选择性和及时性的矛盾2)信息组织的作用:1)信息资源组织:资源描述、内容浓缩、提供 检索点;2)检索工具组织3.按照提供的检索途径,信息组织可分为 哪些类型?题名检索工具(系统)、责任者检索工具(系统)、分类检索 工具(系统)、主题检索工具(系统)、引文检索工具(系统)等2)以信息资源的主题内容特征为检索依据,提供从资源内容进行 检索的途径,主要有分类法、主题法5.简述信息资源处理的基本方法1)信息资源处理是信息组织和揭示的基础,它以处理过的信息记 录作为原信息的替代物来组织信息系统; (2)信息处理的基本方法:1)描述信息资源,以便识别与确认它,主要方法是著录、编写题 录和资源形式特征的描述; 2)浓缩信息资源内容,主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源; 3)提供检索点。
主要方法是确定特定资源的标索特征(或标识)与可检信息信息资 源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、 分类号、主题词或关键词等第2章信息组织原理(一)本章学习目标1.理解信息组织的基本要 求和规范控制的依据; 2.熟练掌握信息组织的控制与规范方法及信 息组织的特点; 3.学会信息组织的描述控制、词汇控制、句法控制 方法,以及检全率、检准率的计算方法; 3.能运用信息组织控制方 法对常见词汇进行规范控制二) 本章重点要点1.信息组织的描述控制、词汇控制、句法控 制; 2.概念的内涵与外延、概念之间的关系,概念的限制与概括、 分析与综合三) 本章练习题名词解释: (1)检全率:是指一次检索中检 出的与提问相关的信息资源数量占系统中所有与提问相关的信息资源数量 的比例,用公式表示为:检全率=检出的相关信息资源量/系统中相关信息 资源总量数某100%4) 职能符号:是一种表示主题标识在组配中的句法职能而规定的 辅助符号5) 轮排转换:依次把检索语句中每一个有检索意义的词轮流排列 在检索位置上6) 引用次序:指复合主题标引或检索时,各个主题因素的组合次 序问答题:1简述对信息组织的要求。
1)检全率是指一次检索中检出的与提问相关的信息资源数量占 系统中所有与提问相关的信息资源数量的比例检全率是衡量检索系统检 索能力和检索效率的重要指标; (2)检准率是指检出的相关信息 资源的数量,占检出的全部信息资源数量的比例检准率是衡量检索系统 排除与提问无关的的信息的能力,较高的检准率可以节省用户时间,提高 系统效率3) 检索速度和系统的及时性检索速度是指用户从实施检索到得 到结果化费的时间,它是衡量系统检索速度与使用效果的重要参数它与 系统响应检索的能力、检全率、检准率、资源组织的全理性等因素有关 系统的及时性是指检索工具处理信息和提供信息所用时间较短,能快速纳 入、处理和提供信息4) 系统易用性是指标引人员使用检索系统描述、标引资源是否 方便和易用;用户使用系统的简易性、方便性与获取信息的容易程度 系统易用性是系统性能的主要因素,决定系统设计改进和发展方向5) 检索的成本效益是指检索系统的成本和效益之比检索成本 包括系统设备费、标引处理费、检索运行费; 检索效益指检索系统创造 经济效益和社会效益好的检索系统是低成本高效益的系统2简述信息资源组织中的规范控制应包括哪些方面?( 1)描述控制: 即对描述记录的内容、描述方进行的控制。
包括描述项目、描述文字、描 述级别、描述格式的控制; (2)词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、规范、揭示相关性的过程主要方法有 同义控制、词义控制、词间关系控制;(3)句法控制:即根据信息资 源标引和检索需要,按一定的组词造句规则对检索语句的组合方式作出的 规定常用的句法措施有确定引用次序、使用辅助符号、以及句式转换 (轮排转换、链式转换、分析转换)3词汇控制的范围是什么? (1) 词汇控制:即根据标引和检索的需要,对自然语言中的的词汇进行优选、 规范、揭示相关性的过程2) 词汇控制的主要措施包括:1)同义控制,是对字面形式不同 而含义相同的词进行控制,使检索系统中一个概念只有一个词语表达包 括对同义词、准同义词及部分专指词与泛指词进行的控制同义控制常用 的方法是在几个词中选取一个作为规范词,在规范词和非规范词之间建立 用代参照,便于用户从非规范词找到规范词同义控制的作用是可以克服 一义多词的自然语言现象,把相同内容或特征的信息资源集中在一起2)词义控制,是对同形异义词和语义含糊的词进行控制,使词义明 确,一个词语只表示一个概念,以控制一词多义现象词义控制常用的方 法是在词后加限义词,在词下增加含义注释和范围注释。
3) 词汇控制还应包括词量控制、词组选择与使用控制、词汇专指 度控制等4句法控制的方法主要有哪些?句法控制是根据信息资源标引和检索 的需要,按照一定的组词造句规则,对检索词的组合方式做出的规定常 见的句法措施有确定引用次序、使用辅助符号和句式转换1) 引用次序,是指复合主题标引和检索时,各个主题因素的组合 次序在分类法中引用次序是指类目划分标准使用的先后次序或各主题分 面在组配时的先后次序;在主题法中是指字顺检索系统中主标题与各级 子标题组合的次序2) 辅助符号,是揭示主题概念之间的关系意义、进行检索操作的 符号常见的有:1)关系符号,是一种用于揭示词语组配中形成的关 系类型的符号,通过对组配中关系类型的表达,对标引词进行控制,说明 组配性质并有一定的排序功能3)职能符号,是一种表示主题标识在组配中的句法职能的符号,可 以明确一个标识串(句子)中各主题因素的施动-受动作用,明确法含义, 提高检准率3)句式转换,是为了使检索句子各个有意义的词素能成为检索入 口字,通过对语句中词语位置的变动来增加检索点常见的有:1)轮 排转换,将检索语句中每个有意义的词依次排在检索入口,其他词在保持 相对位置的情况下移动。
2) 链式转换,以逐次折卸句子链环的方法,将每个有检索意义的的 词语依次排在检索入口3) 分析转换,在一个检索词句中,每次抽取少量的词组配成标题, 依次把每个有检索意义的词排在检索位置上5阐述文献保证原则和用户保证原则2)安排类目的次序也要考虑信息源的实际情况,如文献多的类目排 在文献少的类目之前n实施该原则的前提是必须了解文献源以及文献主题的数量情况,为 此,可以采用文献调查、词汇收集、标引频率统计等手段n(3)在选择分类标准及其引用次序,确定类目的专指度,安排标识的 排列次序等方面考虑用户的使用特点第3章信息描述(一)本章学习目标1.理解信息描述概念、意义与 作用,以及信息描述的规范、HTML、某ML的基本格式和DTD和RDF的基 本概念; 2.熟练掌握基本描述项目、检索点、计算机编码中的MARC格式和DC格式; 3.学会文献描述的基本项目和计算机编码的基本方法; 4.能运用《文献著录总则》格式描述一般文献,能运用简单的HTML格式描述文件二)本章重点要点1.信息描述基本项目、描述级次; 2.检索点的选择与参照法,名称规范档的控制方法; 3. HTML、某ML、DTD、RDF的格式(三)本章练习题。
名词解释:1. DC:是都柏林元素 集的简称,1995年3月在美国小镇都柏林创建的元数据描述方法2. ISBD是《国际标准书目著录》的英文缩写,由国际图联(IFLA) 1969年制定的供各类信息资源描述用的国际标准3. 某ML是可扩展标记语言的简称,是W3C倡议的、在SGML基础上 发展起来的新一代计算机标记语言4. MARC是机读编目格式的简称,是根据文献特点和信息交换需要设 立的标准计算机可读文档格式5. DTD是文件类型定义的简称,原是SGML的重要组成部分,后来成 为W3C的某ML10 一部分6. RDF是资源描述框架的简称,是W3C在1999年颁布的一个建议, 它用资源-属性-属性值来定义一个资源的基本描述框架7. 名称规范档是对描述记录中的名称标目(人名、机构名和资源名) 进行规控制的工具8. 检索点是指检索信息资源使用的题名、责任者、分类号、主题词 等供检索使用的各种数据二)问答题:1什么是元数据,其作用是什么? (1)元数据是关于数据的数据,或关于数据结构化的数据信息描述记录就是元数据结 构化描述的结果2)元数据(或信息描述)的作用就是以元数据为中介,对信息资 源的各元素进行修改、组织或检索等各种操作,包括:1)识别。
通过 个别化描述和确认,让用户可以识别该被组织的资源; 2)定位提供资源的位置信息,便于用户访问该资源或其相关资源常见的定位方法 有:资源顺序号、数据库中的位置、网络地址或其他链接地址3) 检索通过描述数据组织检索工具、向用户提供检索点或检索途 径,在网络或电子检索系统中,可以通过词语匹配等检索技术实现多种特 征的检索4) 选择用户可以通过描述记录中的各种特征,判罪资源价值,确 定是否需要2. 简述我国《文献著录总则》和《DC》的基本著录项目3简述题名检索点和个人责任者检索点的选择方法1)题名检索点的选择方法:1)正题名可以直接选作标目,交替 题名也可选作标目; 2)适当选择有检索意义的副题名和附注项中的合辑题名作标目; 3)并列题名一般不选作标目; 4) 一种资源的题名检点数量要控制在二个以下3) 一般参照(普通参照)是对检索工具某些编制事项的说明,介绍 用户掌握检索系统的使用方法5简述编制名称规范档的过程6. 名称规范档一般由哪些款目构成?规范控制的方法(1)名称规范档通常由规范款目、参照款目、说明款目三种类型组成; (2)常用的规范控制方法有:1)编制规范款目规范款目是检索工具中使用的 统一标目及其有关参照的完整记录,它由七个著录项目组成(见43页样 例); 2)编制参照款目。
参照款目是在检索系统中引导用户从非规范标目查找相。












