好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

信息检索重点复习资料.docx

6页
  • 卖家[上传人]:hs****ma
  • 文档编号:400358541
  • 上传时间:2022-12-08
  • 文档格式:DOCX
  • 文档大小:12.15KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出 有关信息的过程信息素养:人们在解答问题时利用信息的技术和技能信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索, 信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或 知识单元,比文献检索更深入信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联 机检索4)网络检索 2根据检索对象形式不同可分为文本检索、数值检索、音频与 视频检索信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、 存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程 所采用的特征标识达到一致,以便有效的获得和利用信息源存储是检索的基础,检 索是存储的目的信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需 求的词汇或符号及其使用规则构成的供标引和检索的工具信息检索系统是具有信息存储和信息查询功能的一类信息服务设施其物理 结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起 来,以便取得共同理解,实现交流。

      信息检索的历史:最早的信息检索主要依靠信息分类1手工检索 2机械信息检索 3脱机批处理检索是计算机初期使用的一种检 索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型1浏览型模型:扁平式模型、结构导向模型、超文本模型 2检索型模型:结构 化模型、基于内容的检索型模型信息检索模型是信息检索的核心信息检索系统:是具有信息存储和信息查询功能的一类服务设施信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统 DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS.信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系数据库就是在计算机存储设备上按一定方式存储的相互关联的数据集合,由字 段、记录和文档构成数据库的载体分:联机数据库,光盘数据库,网络数据库按内容与功能划分: 指南数据库,交易数据库,全书数据库,书目数据库,字典数据库,数值数据库,图像数 据库书目和全文使用频率最高信息检索系统评价的核心的检索性能评价信息检索评价指标: 1覆盖范围2查全率3查准率4响应时间5用户负担6检 索结果输出格式。

      检索效果指标主要有:1查全率2查准率3漏检率4误检率5新颖率6检索速 度等最主要指标是查全率和查准率查准率P:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例查全率R:是指检出的文献数量占数据库中全部相关文献数量的比例提高检索效果的措施:选择质量较高的检索系统、提高检索着的检索水平第二章网络信息检索的基本方法:1布尔逻辑检索它是一种比较成熟、较为流行的检 索技术,逻辑检索的基础是逻辑运算,它的运算符有逻辑“与” AND *查准,逻辑 “或” OR、+、|查全,逻辑“非” NOT、-lycos;Google的默认运算符是布尔 逻辑与2邻近检索又被称为位置限制检索,是用一些特定的算符来表达检索词与检索 词之间的顺序和词间距的检索Dialog系统常用的位置算符1)(W)表示此算符两侧 的检索词必须按此前后的顺序排列2)(nW)表示在此算符两侧检索词间可插入n个 实词或虚词3)(N)检索项在记录中出现的顺序可以调换4)(nN)表示位置可以调换, 两个词间插入词最多数目是n个4)(F)表示在此运算符两侧的检索词必须同时出现 在文献记录的同一字段内6)(S)表示在此运算符两侧的检索词只要出现在文献记录 的同一字段内,此文献即被命中7)(L)运算符表示两侧的检索词在同一个叙词单元, 且它们之间有一定的从属关系8)(NOT)它与邻近运算符W,N,S,F,L等组合使用,而 产生相反的含义3短语检索短语用“”表示,检索出与“”内形式完全相同的短语,以提高检 索的精度和准确度,因而也称为“精确检索”4截词检索所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分 .根据截词符在检索词中的位置,可分为前截词,中间截词 和后截词。

      代表0到1个字符;“*”代表0到多个字符5字段限制检索为了提高查全率或查准率,需要将检索范围限制在特定的字段 中,6括号检索 7自然语言检索 8多语种检索 9模糊检索 10区分大小写检索信息检索的主要技术:1 全文检索技术全文检索技术必须具备一个全文数据库, 全文数据库是将一个完整的信息源全部内容转化为计算机可以识别,处理的信息单 元而形成的数据集合全文数据库的特点:a信息量大b信息检索的灵活性和适应 性c检索语言的自然性d数据相对稳定等不足:查准率较低2多媒体信息检索技术 音频检索分三种:a语音检索b音乐检索c音频检索3超文本超媒体检索技术超文 本检索是信息的组织方法与手段超文本超媒体的缺陷:信息以超文本方式链接,用户 检索的主动性变为被动性,导致检索过程中含有极大的盲目性和偶然性;在链接的过 程中,容易偏离检索目标,导致检索“迷航”其发展趋势:由超文本向超媒体发展,由 超媒体向智能超媒体发展,由超媒体向开放超媒体发展 4智能信息检索技术采用 人工智能进行检索的技术,与传统信息检索相比,它最大的特点是检索过程中引入了 资源对象的语义处理智能化是网络信息检索未来发展的主要方向 5可视化信 息检索技术基础是计算机图形学和认知心理学。

      6跨语言信息检索技术跨语言信 息检索技术的核心问题是“翻译” 7文本聚类技术常用的聚类方法有:层次聚类 法,平面划分法,网格聚类法,模型聚类法等检索策略:是为实现目标而实行的全盘计划,在操作上主要指数据库的选择和检索式的编制网络)信息检索的技巧:1、分析信息需求即要确切了解所要查询的目的和要 求,确定需要的信息类型2、选择合适的检索工具不同目的的检索应选择不同的搜 索引擎,选择合适的检索工具主要从工具的类型、收录范围、检索问题的类型、检 索具体要求等方面综合考虑3、确定检索点与检索词关键词选择的建议:1)使用名 词或物体做关键词2)检索式使用2~3个关键词为宜3)使用截词检索4)通过or连 接同义词、近义词等不同表达式5)对专有名词使用大写字母指定检索6)对固定短 语使用短语检索7)用括号将各个概概念分开4、 正确构造检索式许多搜索引擎都提供简单查询和高级查询,建议使用后 者5、 及时调整检索策略(扩大检索范围,缩小检索范围)6、 检索结果的输出(下载,打印,复制,显示,E-mail发送等)第三章搜索引擎的概念及工作原理:它是一种web上应用的软件系统,它以一定的策 略在web上搜集和发现信息,在对信息进行处理和组织后,为用户提供web查询服 务。

      当用户输入关键字查询时,该搜索引擎会告诉用户该关键词的信息和网址,并提 供连接;同时,用户可通过一层层分类目录找到所需信息搜索引擎既用于检索的软 件又提供查询、检索网站搜索引擎:有三个功能模块,或三个子系统:及网页搜索、预处理和查询服务 搜索引擎的分类:1按信息内容的组织方式划分a目录式搜索引擎Yahoo是目前最 流行的目录式搜索引擎,提供主题目录检索B机器人搜索引擎2按专业范畴划分 a综合性搜索引擎b专业性搜索引擎3按检索功能划分a独立搜索引。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.