
本科信息检索02.ppt
67页主主讲讲::靳靳小小青青信息检索 XIN XI JIAN SUO 第二章信息检索系统第二章 信息检索系统信息检索系统【本章主要介绍】 u 讲解信息源与信息媒体、信息检索原理 u 讲解检索语言、信息检索方法、途径和步骤u 讲解信息检索系统与检索工具 u 讲解数字图书馆u 讲解结构化信息与非结构化信息第二章信息检索系统第二章 信息检索系统信息检索系统2.1 信息源与信息媒体信息源与信息媒体 2.2 信息检索原理信息检索原理 2.3 检索语言检索语言2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤2.5 信息检索系统与检索工具信息检索系统与检索工具小结小结2.7 结构化信息与非结构化信息结构化信息与非结构化信息2.6 数字图书馆数字图书馆第二章信息检索系统2.1 信息源与信息媒体信息源与信息媒体2.1.1 信息源的概念信息源的概念 2.1.2 信息媒体信息媒体 第二章信息检索系统2.1.1 信息源的概念信息源的概念 2.1 信息源与信息媒体信息源与信息媒体 信息源就是获取信息的来源联合国教科文组织(UNESCO)出版的《文献术语》对其定义为:组织或个人为满足其信息需要而获得信息的来源,称为“信息源”。
从绝对意义上看,只有信息产生的“源头”,才能称为信息源第二章信息检索系统2.1.1 信息源的概念信息源的概念 2.1 信息源与信息媒体信息源与信息媒体 但信息源是一个相对的概念,凡能产生、拥有和传递信息的所有物质皆谓信息源由此看来信息源内涵丰富,它不仅包括各种信息载体,也包括各种信息储存、传递、生产机构第二章信息检索系统2.1.1 信息源的概念信息源的概念 2.1 信息源与信息媒体信息源与信息媒体 但在图书情报界则认为:人们在科研活动、生产经营活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的产品都可称为信息源因此又有口头型信息源、实物型信息源和文献型信息源之说 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体 信息媒体是指信息传播的介质、信息表示的载体,也称为信息媒介或信息载体这些信息媒体可以是文字、图形、图像、动画、声音、视频等信息表示形式,也可以是扬声器、磁盘阵列服务器、电视机等信息的展示设备,还可以是传递信息的光纤、电缆、电磁波等中介媒质,以及存储信息的缩微胶卷、磁盘、光盘、磁带等存储实体。
而在图书情报界则从文献型信息源的研究视角出发,将信息媒体大致划分为传统文献信息媒体和电子文献信息媒体两大类 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体1. 传统文献信息媒体 传统文献信息媒体主要是指传统图书馆收录的各种文献信息媒体总汇若把传统文献信息媒体再进行细分,又可分为多种类型第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体1.传统文献信息媒体2.(1)按文献信息载体形式划分3. ① 印刷型 4. ② 缩微型 5. ③ 机读型 6. ④ 声像型第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体1.传统文献信息媒体2.(2)按文献信息媒体内容特征或加工程度分3. ① 零次文献 4. ② 一次文献 5. ③ 二次文献 6. ④ 三次文献 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体1.传统文献信息媒体2.(3)按文献信息媒体的内容形式划分3. ① 图书。
4. ② 连续出版物5. ③ 会议文献 6. ④ 专利文献7. ⑤ 科研报告8. ⑥ 标准文献9. ⑦ 学位论文 10. ⑧ 政府出版物11. ⑨ 产品目录与样品 12. ⑩ 技术档案 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体2. 电子文献信息媒体 (1)根据载体的存储形态划分 ① 光盘文献信息媒体 ② 联机文献信息媒体 ③ 网络文献信息媒体 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体2. 电子文献信息媒体 (2)根据数据库的检索对象进行划分 ① 参考数据库 ② 源数据库 第二章信息检索系统2.1.2 信息媒体信息媒体 2.1 信息源与信息媒体信息源与信息媒体2. 电子文献信息媒体 (3)根据网络传输协议进行划分 ① WWW信息媒体 ② FTP信息媒体 ③ Telnet信息媒体 ④ Gopher信息媒体 第二章信息检索系统2.2 信息检索原理信息检索原理 信息检索原理可从信息检索过程得到很好的诠释,如图2-1所示,用户在检索时,检索系统一方面接受用户的检索提问,另一方面从数据库(检索工具)中接受文献记录,然后在两者之间进行匹配运算,即将检索提问与数据库(检索工具)中文献记录标识进行比较,如果比较结果一致或数据库(检索工具)中的文献记录标识包含了检索提问标识,那么具有该标识的信息可能就是用户所要的命中文献;如果比较结果不一致,则要重新提交检索提问。
第二章信息检索系统2.2 信息检索原理信息检索原理 图2-1 信息检索原理示意图第二章信息检索系统2.3 检索语言检索语言 2.3.1 检索语言分类检索语言分类 2.3.2 分类语言分类语言2.3.3 主题语言主题语言 第二章信息检索系统2.3.1 检索语言分类检索语言分类 2.3 检索语言检索语言 检索语言是根据文献标引与检索的需要,在自然语言的基础上规范化了的人工语言,它贯穿于文献存储与检索的全过程,是沟通标引人员和检索人员双方思想的约定语言 , 也 有 人 称 为“标 定 符 号”或 “标 识 系 统”检索语言的种类颇多,其中按描述文献信息的特征进行划分是目前最常见的一种,如表2-1所示第二章信息检索系统2.3.1 检索语言分类检索语言分类 2.3 检索语言检索语言 表表2-1 检索语言分类检索语言分类第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 分类语言是将文献信息按学科、事物性质的等级体系加以排列,用分类号来表达文献主题概念的检索语言分类语言的具体表现形式就是分类表(法)。
分类法(表)是类分和组织文献信息以及用户检索文献的共同依据第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 分类语言有3种,最常用的是体系分类语言体系分类语言以文献内容的科学性质为对象,从学科分类观点出发,运用概念划分的方法,将知识分门别类地按逻辑次序,从总到分、从一般到具体、从低到高、从简到繁进行层层划分、层层隶属,逐级展开一个层类制的等级结构体系第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 在此以《中图图书馆分类法》(简称《中图法》) 为例说明体系分类语言的构成《中图法》将全部知识分为5个基本部类,即马列主义、毛泽东思想、邓小平理论,哲学,社会科学,自然科学和综合性图书在5大部类下又展开为22个基本大类(一级类目),如表2-2所示 第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 表表2-2 《《中图法中图法》》基本大类基本大类第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 《中图法》的标记符号采用汉语拼音字母、阿拉伯数字和圆点相结合的混合制号码作为分类号,用字母表示基本大类(一级类目),在字母后用数字表示基本大类下类目的划分,唯独工业技术大类下用两位字母表示二级类目。
《中图法》的分类号越长,代表的内容越具体,检索出的文献越精准,如图2-2所示第二章信息检索系统2.3.2 分类语言分类语言2.3 检索语言检索语言 图2-2 《中图法》2-5级类目图第二章信息检索系统2.3.3 主题语言主题语言 2.3 检索语言检索语言 主题语言是直接用自然语词作主题概念标识,并用字顺排列标识和参照系统等方法来间接表达各种概念之间的相互关系的一种检索语言主题语言的具体表现形式是主题词表,主题词表也像分类表一样是文献标引人员与用户检索文献的共同依据第二章信息检索系统2.3.3 主题语言主题语言 2.3 检索语言检索语言 主题语言根据构成原则与编制方法不同,可分为以下4种1)标题词语言(标题词法)(2)单元词语言(单元词法)(3)叙词语言(叙词法)(4)键词语言(关键词法)第二章信息检索系统2.3.3 主题语言主题语言 2.3 检索语言检索语言 这4种语言可统称为主题法系统其中标题词法、单元词法、叙词法是用规范化名词标引和检索文献的主题概念语言,按这些规范化名词的字顺编排为词表分别称为标题词表、单元词表和叙词表;关键词法是指直接选自文献标题或内容中具有实质意义的自然语言作为标引和检索文献的语言。
因此,关键词法是未经规范化处理的自然语言,无受控词表第二章信息检索系统2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 2.4.1 信息检索方法信息检索方法 2.4.2 信息检索途径信息检索途径2.4.3 信息检索步骤信息检索步骤 第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 信息检索方法应据课题的目的、性质和检索工具的现状灵活选定一般来说,可以从手工检索和计算机检索两方面分别叙述第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1.手检方法2.(1)常用法 常用法是信息检索中最常用的一种方法,因为是利用检索工具来查找,故又称为工具法其按查找时间的顺序不同又可分为顺查法、倒查法和抽查法3种第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1.手检方法(2)追溯法 追溯法又叫回溯法,是以某一篇论文末尾所附的参考文献为依据,逐一追踪地检索方法。
该法的连锁反应,可查到有关某一专题的大量参考资料该法直观、方便,在不备检索工具的情况下,是一种扩大情报源的最好办法,但检索效率低、漏检率高如果能使用有关的引文检索工具(见3.3节“美国《科学引文索引》”和4.5节“中国社会科学引文数据库”),则可获得较好的效果第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1.手检方法2. (3)分段法 分段法是交替使用以上所提的两种方法,因而又叫循环法具体来说,就是先使用检索工具查找某课题几年内的资料,再利用该资料末尾所附参考文献追溯查找一般5年之内的文献被引用参考的较多,因此可以只追溯5年左右的时间,然后再用检索工具查出一批文献进行追溯,这样分批分段地交替进行,如此循环,直至认为够用为止第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1.手检方法2.(1)常用法3. ① 顺查法4. ② 倒查法5. ③ 抽查法第二章信息检索系统2.4.1 信息检索方法信息检索方法 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 2. 机检方法 随着信息技术的发展,计算机检索将逐步占有主导地位。
计算机检索方法也称检索方式或检索界面,目前参差不齐一般计算机检索方法没有固定模式,主要可归纳为以下几种 (1)基本检索 (2)高级检索 (3)专业检索4)分类检索 (5)二次检索第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 检索途径通俗地讲就是查找文献信息的入口,在手检中,检索入口取决于检索工具提供的索引的多少,在机检中,检索入口取决于数据库提供的检索字段(手检中文献的著录项目)但是检索工具提供的索引有限,而数据库提供的可检索字段几乎覆盖了组成文献的全部著录项目因此,机检比手检的检索入口宽泛了许多本书仅介绍以下几种主要的检索途径第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1. 文献名称途径 文献名称途径是根据书刊篇名名称途径进行查找的一条途径如各种题名字段、书名目录、篇名索引、刊名一览表等检索工具皆是用此途径检索它是把文献名称按照字顺编排起来的检索系统使用时,与查字典相似。
第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 2. 著者途径 著者途径是以著者姓名为线索的检索途径这里的“著者”包括个人著者、团体著者、专利发明人、专利权人、合同用户、学术会议召集单位等著者姓名途径主要是利用著者字段、著者目录、著者目录(索引)、团体著者目录(索引)、专利权人索引、机构字段、机构索引等这些字段、目录(索引)都是按其姓名字顺编排,在已知著者的前提下,很快就可查到所需文献但要注意外国与中国著者书写上的区别第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 3. 号码途径 号码途径是利用文献信息自身的编号检索文献的一条途径许多文献有固定的注册编号,如报告号、标准号、专利号、合同号、馆藏号、索书号等,一般都是按字母和数字顺序排列第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 4. 分类途径 分类途径是按照文献信息的知识内容及所属学科性质而类分和检索文献的途径。
常用的工具有分类字段、分类目录和分类索引等分类途径的检索依据是分类法或称分类表也称分类语言(见2.3.2小节“分类语言”),使用这种检索途径的关键是熟悉和掌握分类表对于文献信息的学科分类,世界各国都有自己的分类法,此外对于不同的文献,可能要采用不同的分类法如专利文献要使用专利分类法,标准文献要采用标准分类法等第二章信息检索系统2.4.2 信息检索途径信息检索途径 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 5. 主题途径 主题途径是通过代表文献信息内容的主题词来检索文献的一条途径常用的工具有主题字段、关键词字段、主题索引、叙词索引、关键词索引等主题途径的检索依据是主题语言(见2.3.3小节“主题语言”),使用这种检索途径的关键是熟悉和掌握主题词表第二章信息检索系统2.4.3 信息检索步骤信息检索步骤 2.4 信息检索方法、途径和步骤信息检索方法、途径和步骤 1.分析研究课题 2.选择检索工具或数据库 3.确定检索途径(检索字段)及检索方法(检索方 式),形成检索标目(构造检索提问式)4.实施检索5.索取原始文献。
第二章信息检索系统2. 5 信息检索系统与检索工具信息检索系统与检索工具 2.5.1 信息检索系统信息检索系统 2.5.2 信息工具信息工具 第二章信息检索系统2.5.1 信息检索系统信息检索系统 2.5 信息检索系统与检索工具信息检索系统与检索工具 信息检索系统是集信息收集、加工、存储、检索和管理于一体的信息服务系统一般来说,组成信息检索系统的基本要素有:文献信息、检索设备、检索语言、信息存储方法与检索方法、系统管理维护人员和用户这几大要素的运行情况直接反映着信息检索系统的服务效果信息检索系统按其检索方式可分为手工检索系统和计算机检索系统第二章信息检索系统2.5.1 信息检索系统信息检索系统 2.5 信息检索系统与检索工具信息检索系统与检索工具 1. 手工检索系统 手工检索系统由手工检索设备(目录、题录、文摘、索引、卡片等)、检索语言及文献库等组成该检索系统检准率高、成本低,但检索速度慢、效率低第二章信息检索系统2.5.1 信息检索系统信息检索系统 2.5 信息检索系统与检索工具信息检索系统与检索工具 2. 计算机检索系统 计算机检索系统由计算机检索设备(光盘检索设备、联机检索设备、网络检索设备等)、检索语言及数据库等组成。
该检索系统检索效率高、检索范围广、内容全,但检索费用高、灵活性差第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 检索工具是按照一定的学科或主题范围、将所收录文献的条目和检索标识依据一定的规则(检索语言)编排组织在一起的二次文献其中文献条目指描述文献外部特征(题目、著者、出处)和内容特征(主题词、分类号)的记录单元被标引了的文献特征叫检索标目(检索标识),它是存储和检索文献的入口词只是在机检中文献条目称字段,且所有字段都可作为检索入口词第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 其实广义的检索工具与检索系统是一致的,只是在手检中习惯称检索工具,在机检中多数称为检索系统或数据库检索工具的类型众多,本书仅按检索手段划分,将其分为手工检索工具和计算机检索工具两大类第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 1. 手工检索工具 手工检索工具是指无须借助任何辅助设施即可处理和查询的检索工具,多指那些传统的印刷型检索工具。
手工检索工具主要通过“手翻、眼看、大脑判断”方式进行浏览、检索,因此,检准率高,但检索速度慢、效率低若按其著录内容细分,可划分为以下3种第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 1. 手工检索工具(1)目录(题录) 目录是描述文献外部特征的文献条目,并按一定的次序编排起来的集合体文献的外部特征包括题名、著者、出处、文种等,其特点是报道及时且量大,但揭示文献深度不够目录的著录对象可以是整本文献,也可以是单篇文献(题录)第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 1. 手工检索工具(2)文摘 文摘是除题录外还对文献内容做实质性描述的文献条目,即比目录(题录)式检索工具多一项内容摘要条目因此文摘性检索工具在揭示报道文献的深度及实用性等方面都优于题录,有时甚至能代替原文,从而可大大节省查阅时间、起到 事 半 功 倍 之 效 文 摘 是 检 索 工 具 的 主 体 文 摘 有 报 道 性 文 摘 、 指 示 性 文 摘 和 评 论 性 文 摘3种 。
第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 1. 手工检索工具(3)索引 索引是将事物标识(著者、关键词、主题、分类等)及其有关指引线索,按照一定的顺序加以排列,并注明其所在文献中的位置(页码或文摘号等),以便检索相应文献的检索工具它的特点是用户利用简单、方便,但也和目录一样未能反映文献内容第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 2. 计算机检索工具(1)光盘检索 即采用计算机作为手段、以光盘作为信息存储载体和检索对象进行的信息检索系统第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 2. 计算机检索工具(2)联机检索 联机检索是一台主机带多个终端的计算机信息检索系统,它具有分时操作能力,能使许多相互独立的终端同时进行检索这种检索是用户使用计算机终端设备通过通信线路,直接与主机对话,用户可输入提问表达式并马上得到答案联机检索系统一般都设有数百个数据库,而每个数据库又包括几十万、几百万条数据信息。
第二章信息检索系统2.5.2 检索工具检索工具 2.5 信息检索系统与检索工具信息检索系统与检索工具 2. 计算机检索工具(3)网络检索 该系统同联机检索系统的主机和用户终端的主从关系不同,网络检索是基于客户机/服务器的网络支撑环境的,客户机和服务器是同等关系,只要遵守共同协议,一个服务器可被多个客户访问,一个客户也可以访问多个服务器Internet便是该系统的典型网络信息检索是基于Internet的分布式特点开发和应用的,用户只要通过网络接口软件,即可在任一终端机上查询世界各地上网的信息资源随着信息技术的发展,网络将成为信息源传递的主要渠道第二章信息检索系统2. 6 数字图书馆数字图书馆 2.6.1 数字图书馆由来数字图书馆由来 2.6.2 数字图书馆定义数字图书馆定义 第二章信息检索系统2.6.1 数字图书馆由来数字图书馆由来 2. 6 数字图书馆数字图书馆 数字图书馆是相对传统图书馆而言的传统图书馆是一个人们看得见、摸得着、拥有一定数量馆藏和管理人员的一个物理建筑,是一个集收集、整理、保存、传递文献信息于一体的社会文化教育机构。
在传统图书馆中,可通过以手工操作为主的工作人员,利用馆内的各种文献信息,为一定范围的读者提供服务随着信息技术的发展,图书馆所收集信息的载体也发生了变化,由单一的印刷型发展成缩微型、机读型、声像型等几种形式并存,因此有人称其为电子图书馆而网络技术的发展又使得图书馆打破了地域和时间的限制,使人们无论何时、何地都可以访问图书馆的信息,因而又有人称其为没有围墙的图书馆鉴于这种图书馆是在网上访问的,而非现实当中存在的真实物理建筑实体,于是又有人称其为虚拟图书馆,由于其信息都是以计算机能识别的二进制的形式存储,因而又出现了数字图书馆的概念第二章信息检索系统2.6.2 数字图书馆定义数字图书馆定义 2. 6 数字图书馆数字图书馆 1. 美国数字图书馆联盟(DLF)定义(1998)2. William Y. Arms定义3. 孙坦定义4. 国家图书馆定义5. 大英图书馆定义6. 百度百科对数字图书馆定义的概括第二章信息检索系统2.6.2 数字图书馆定义数字图书馆定义 2. 6 数字图书馆数字图书馆 1. 美国数字图书馆联盟(DLF)定义(1998) 数字图书馆是一个拥有专业人员等相关资源的组织,该组织对数字式资源进行挑选、组织、提供智能化存取、翻译、传播、保持其完整性和永存性等工作,从而使得这些数字式资源能够快速且经济地被特定的用户或群体所利用。
第二章信息检索系统2.6.2 数字图书馆定义数字图书馆定义 2. 6 数字图书馆数字图书馆 6. 百度百科对数字图书馆定义的概括 通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心数字图书馆既是完整的知识定位系统,又是面向未来Internet发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播 第二章信息检索系统2. 7 结构化信息与非结构化信息结构化信息与非结构化信息 2.7.1 结构化信息结构化信息 2.7.2 非结构化信息非结构化信息 第二章信息检索系统2.7.1 结构化信息结构化信息 2. 7 结构化信息与非结构化信息结构化信息与非结构化信息 数据分为结构化数据、半结构化数据和非结构化数据 结构化信息是结构化数据的产物,是指经过严格的标引后的数据,一般以二维表的形式存在也就是通常所说的可以数字化的数据信息,这些数据信息可以方便地通过计算机和数据库技术进行管理。
如电子商务信息,多数出版商发行的各种文摘、数值、全文数据库皆属于此也有人从信息的表现形式上称为显性信息,信息的性质和量值的出现的位置是固定的,有规律可循本书所介绍的信息检索,主要是针对结构化信息而言第二章信息检索系统2.7.2 非结构化信息非结构化信息 2. 7 结构化信息与非结构化信息结构化信息与非结构化信息 非结构化信息是非结构化数据的产物,是指各种看似相关性比较弱、无法用关系型数据库等结构化的方式来获取和处理的信息通俗地说是没有经过人为处理的不规整的信息即无法完全数字化的信息,如文档文件、多媒体信息、企业内外部的新闻邮件、合约、票据、文书处理、电子表格、采购记录、Internet上的消息、BBS等也有人从信息的表现形式上称非结构化信息为隐性信息这些信息中隐性包含了掌握企业命运的关键信息,隐含着诸多提高企业效益的机会第二章信息检索系统2.7.2 非结构化信息非结构化信息 2. 7 结构化信息与非结构化信息结构化信息与非结构化信息 非结构化信息有其自己的一些特点,其所有内容都是不可预知的,格式多样化,无统一标准,不像结构化数据一目了然。
特别是多媒体数据中蕴涵着大量的非结构化信息所以对非结构化信息的整合、存储、检索、发布等都带来了一系列的挑战 第二章信息检索系统2.7.2 非结构化信息非结构化信息 2. 7 结构化信息与非结构化信息结构化信息与非结构化信息 据媒体和研究报告报道85%以上的信息都在“结构化”世界之外它们在证券、银行、保险、工商、地税、图书馆等行业中得到广泛应用,因此如何有效的开发非结构数据,对其进行管理,提取当中的隐含信息,对决策进行支持成为当今亟待解决的主要问题第二章信息检索系统 本章主要介绍了与信息检索有关的一些基本概念,如信息源与信息媒体、信息检索原理、信息检索系统与检索工具、数字图书馆、结构化信息与非结构化信息,重点讲述了检索语言、信息检索方法、途径和步骤小结小结。












