好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

信息获取与信息检索讲解.ppt

44页
  • 卖家[上传人]:我**
  • 文档编号:115797870
  • 上传时间:2019-11-14
  • 文档格式:PPT
  • 文档大小:2.96MB
  • / 44 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第二讲 信息获取与信息检索 信息获取 信息检索原理 信息检索途径 一、信息获取 1.信息获取的概念 人们为得到所需信息进行的各种活动与过 程 要求:￿ (1)准确性原则获取信息的准确性;￿ (2)时效性原则最少时间、最快速度;￿ (3)连贯性原则全面、完整; (4)开拓性原则捕捉信息、注重信息之间 的关联,开发信息￿ 2.信息获取方式￿ 信息获取方式:人们获取信息的方法与形式 人类的社会活动形形色色,获取信息的方式也千 差万别 一个招聘的故事: 上网、114、户外广告牌、图书馆 (1)从交流渠道看￿ 信息交流主要有正式交流和非正式交流两种方式 ①从正式交流渠道获取通过出版发行系统、图书馆 系统、情报(信息)所系统、档案馆系统等信息机构 获取信息 通过购买,或通过信息检索、咨询、外借、阅览、复 制等方法获得 常设机构,保障度高 ②从非正式交流渠道获取由信息创造者与信息接收 者双方直接完成的交流 直接对话、会议、参观、访问、演讲、书信、信息发 布会等 随机性强 ,保障度低 (2)从公开程度看 ￿ ①非常手段获取采用隐蔽的、异常的方式获取信息 窃听、窃取、策反、侦察、网络黑客等 女艾——中国历史上有文字记载的第一个间谍。

      太康、后羿、寒浞、浇(ao)与殪(yi)、相、少康、女艾 开始用于军事信息、政治信息,现对于经济信息、科技信息的 收集的使用也日趋增加德国就有50000多名职业经济间谍, 再如日本一些大的企业,外派经济间谍往往超过千人 ②正常手段获取采用公开的、合法的方式获取信息 利用报纸、广播、电视、购买、交换等方式 英国人雅各布摘抄德国报纸、小册子、德军的编制结构、160 多名部队指挥官的姓名简历、希特勒追查 (3)从信息载体看￿ ①网络检索法在高速信息网中获取信息、传递信息的 方法 因特网已成为世界上最大的信息宝库,它是全球范围 内传播和交流科研信息、教育信息、文化信息、商业 信息、政府信息以及消闲娱乐信息的重要渠道 ②报刊阅读法通过对报刊的摘录获取所需信息 如通过阅读《中国物价》、《价格理论与实践》等报 刊,能了解到价格管理体制改革、以及全国物价总水 平变动等方面的信息 ③广播收听法是指通过收听广播获得所需信 息的方法每一个广播电台都能够提供很多 有价值的信息,只要我们做一个有心人,就 可以通过收听广播获得大量信息 ￿ ④电视收看法是指通过收看电视获取信息的 方法通过中央电视台、各省电视台以及各 市电视台的新闻节目,可以收集到很多政治 、经济、科技、文化、教育方面的信息。

      ⑤电信接收法电信接收法是指通过、电 报获取信息的方法电报是两条很重 要的信息传递通道 ⑥电脑显示法很多信息都储存在数据库中, 如果我们想查询有关信息,只要敲一下键盘 ,显示器上就可显示出来 ￿ ⑦对面交谈法面对面交谈法是指通过两个人 或多个人的交谈获取信息的方法 ⑧信息咨询法通过向咨询公司询问、通过通信询问 来收集信息 ⑨文件研究法从文件中寻找所需信息的方法如通 过对国外有关文件的研究,可以了解有关国家的政 治、经济、科技、军事、文体、教卫等多方面的信 息 ⑩工具检索法利用各种检索工具、参考工具、资料 工具、边缘工具等获取有关信息 (4)从获取形式看 ￿ ①会议获取法出席各类会议可以获得有关信息,如 学术讨论会、经济交流会、技术鉴定会、产品展销 会、选样会、订货会、交易会、展览会、计划会、 信息发布会、科技交流会、外贸会等 ②行业获取法从中央各部委到各省、市、自治区, 一直到各企业,都成立了有关的行业组织机构,在 横向上和纵向上进行联合,组成了各类信息网络 ③现场调查法是指派专人深入第一线,直接对信息 进行收集通过参观访问或现场考察,能直接了解 研究单位、生产单位或经销单位的具体情况,对有 价值的新产品、新设备、新工艺、新方法等,除了 文字记录外,还可以拍摄照片、录像或录音。

      ④资料索得法对相关文献资料的获得是掌握信息的 有效方法如: 直接索取,直接向生产者或编撰者索取产品目录、商 业广告等; 互赠互换,用自己的文献与他人交换 ⑤公关获取法利用公共关系可获得一些有用的信息 如:参加社交,通过各种“沙龙”、庆典活动获 得信息;利用机构团体,通过上级部门、科研单位 、高等院校、各种学术团体和社会团体 ⑥委托搜集法,可委托有关单位和人员帮助搜集,如 咨询服务单位、出版发行单位,以及营销人员、个 人的亲戚朋友、同事、上级或部下等 ⑦定点搜集法是指聘请信息收集员进行定点信息收 集的方法如可在每一大、中城市中聘请一位信息 收集员,随时向信息中心报告所掌握的各种信息 ⑧有偿购买法是指从有偿信息服务机构购买信息的 方法如:国家经委的中国经济信息中心、国家旅 游局的中国旅游信息中心,可以购买到所需要的信 息 ⑨数据核算法是指利用会计和统计的方法加工、核 算出新信息比如我国工业产值在国民经济总产值 中的比例信息,就要通过会统核算方法进行等 兵与灶 ⑩预测分析法是指用预测的方法来估算未来事物发 展变化信息的方法主要有经验判断法、典型调查 法、专家综合分析法、数学模型法等等 日本获取大庆油田的秘密。

      二、信息检索原理 1.信息检索的概念 信息利用的关键在于信息获取,而信息获取的核 心则是信息检索信息检索,是指从有序的信息资 源中查寻所需信息的过程 广义的信息检索包括存贮与查询 (1)存贮过程 把大量杂乱无序的信息加以科学地组织,形成一个 信息集合体 ●选材:从信息资源中选择一定范围和水平的信息 ●分析:对被选定的信息素材的内容主题及其它有检 索意义的特征进行分析 ●浓缩:用有效形式对信息的内容及物质形态的特征 进行记录,以形成条目、单元 ●标识:为条目、单元赋予检索标识 ●排序:对条目、单元进行有序地排列,使之成为一 个能随时存取的检索系统 (2)查询过程 存贮的逆过程,即从已经组织好的信息集合体中查 检和索取出所需的信息 ●定题:信息用户将自己的信息需求加以明确化 ●择库:选择符合信息需求的检索工具、网站或数据 库 ●提问:形成检索提问,对检索提问进行概念分析并 用检索系统所用词表中的词加以表达 ●查询:有次序地在检索系统中查寻同检索词相一致 的检索标识,实质上是信息用户的检索提问与检索 系统中的检索标识相匹配而决定取舍的过程 ●索取:对检索结果进行筛选,或获得原始信息 2.信息检索的类型 (1)书目检索。

      以文献线索为检索内容 检索系统存贮的是书目、索引、文摘等“二次文献”, 它们是文献的外表特征与内容特征的描述,是文献 的“替代物” 检索获得的是与检索课题有关的一系列文献线索,然 后再通过阅读决定取舍 (2)数据检索以数值为检索内容 检索系统存贮的是大量的数据,包括物质熔点、电 话号码、统计数据等数字数据,也包括图表、化合 物分子式和结构式等非数字数据,并提供一定的运 算推导能力 这些数据是经过专家测试、评价、筛选过的,信息 用户可直接用来进行定量分析 (3)事实检索以事项为检索内容的信息检索检索 系统存贮的是从原始文献中抽取的事实,并有简单 的逻辑判断能力检索获得的是有关某一事物的具 体答案如检索机构、产品、广告等 (4)全文检索检索系统存贮的整篇文章乃至整本图 书的全部文本,可检索出整篇文章,或检索出有关 的句、段、节、章等文字,并能进行各种频率统计 和内容分析 (5)音像检索以声音和图像为检索内容的信息检索 例如利用因特网可以实现超文本和多媒体形式的 网络信息检索,可检索一张图片、一段影像、音乐 3.信息检索系统 (1)信息检索系统的概念 简称检索系统,是指拥有一定的存贮、检索技术设备 ,存贮有经过加工的信息,并能为信息用户提供所 需信息的一种工作系统。

      信息检索系统是信息检索过程中的中枢,功能: 吸收信息 加工信息 存贮信息 检索信息 信息检索系统一般分 为以下类型:￿ (1)手工检索系统指 完全依靠人工操作 方式检索信息的工 具或设施,如卡片 式或书本式的目录 、索引、文摘、参 考工具书以及手工 穿孔卡片等 ￿ (2)计算机检索系统把 信息存贮在计算机存贮 设备(如磁带、磁盘、 磁鼓等)上,再利用计 算机根据程序进行检索 人们习惯将计算机检 索系统称为“检索系统 ”,将手工检索系统称 为“检索工具”包括 单机检索系统、联机检 索系统、网络检索系统 、光盘检索系统 (2)信息检索系统的评价 ●查全率:检索系统在进行某一课题检索时,检出的 相关文献量与系统数据库中相关文献总量的比率 假设该系统总共存入和该课题相关的文献30篇,检 索时查出了其中的18篇,这次检索的查全率就等于 18/30×100%=60%查全率是用来描述检索系统检 出相关文献能力的一种尺度 ●查准率:检索系统在进行某一课题检索时,检出的 相关文献量与检出文献总量的比率假定上面提到 的那次检索总共查出36篇文献,经审查确定其中18 篇是相关的,而另外18篇与该课题无关这样,这 次检索的查准率就等于18/36×100%=50%。

      查准率 是用来描述检索系统拒绝不相关文献能力或检索精 确度的一种尺度 ●收录范围:是指检索系统数据库覆盖的学科范围、 信息类型、数量和时间跨度数据库的收录范围全 面,才能保证真正的查全,可以把收录范围看作是 查全率的延伸 ●响应时间:在委托检索中,它表示从送交提问到收 到检索结果所需的时间 ●用户负担:是指用户在检索过程中花费的精力的总 和 ●输出形式:检索系统检出的信息的形式,可能是文 献号、题录、文摘或全文等输出的信息越多并且 便于浏览,用户就越容易做出相关性判断 三、信息检索途径 人们检索信息,都是以信息的某一特征作为出发点, 从一定的途径进行的 以文献为例,文献的内容特征和外表特征都可以成为 检索的出发点 1.分类途径 分类途径,是根据信息的内容类别进行检索的途径 要熟悉检索系统所采用的分类法分类法又叫分类表 要顺利地判断自己所研究 的课题、所需要的信息的 分类归属,按检索工具所 采用分类体系的部类、大 类、小类、子目、细目逐 级查找,层层区别,直至 适宜为止 文献分类 《北京图书馆国外博士学 位论文目录(1982~1992)》 20类 网络分类 “新浪网分类” 30多个 频道 2.主题途径 主题途径,是根据信息内 容的主题特征进行检索 的途径。

      表示信息主体所论述和研 究的事物或问题的概念 叫做主题 用以表达信息主体主题概 念的词叫做主题词 主题词表是把主题词按照 一定方式组织的集中性 词汇表 主题途径又分为: v标题途径: 规范化 v单元词途径: 组配 v叙词途径: 规范化、组配 v关键词途径: 自由词 3.文献名称途径 文献名称途径,根据文 献外表的名称特征 进行检索如:书 名目录或索引、刊 名目录或索引、篇 名目录 文献来源索引:介绍该 工具摘录的刊物名 称、出版情况及价 格等情况的一览表 4.责任者途径 责任者途径,根据信 息主体责任者的名 称特征进行检索 “责任者”不仅指作 者、译者、编者, 还包括专利发明人 、专利权受让者、 研究合同户、会议 召集单位等,既有 个人责任者,又有 团体责任者 5.代码途径 代码途径,是根据信息单元的序号或代号检索信息的 途径 许多类型的文献往往都有唯一性序号,例如专利号、 报告号、合同号、标准号、国际标准书号(ISBN)、 国际标准连续出版物编号(ISSN)等; 在某些学科或专业文献中,也有一些特殊的代号,如 化学化工方面的分子式、化学物质登记号、韦氏线 型代码、拓扑代码等 6.引文途径 引文途径:根据文献所 附参考或引用文献的 特征进行检索的途径 。

      论文写作需参考有关文 章,或作为理论根据 ,或作为比较对象, 或取其数据,或对某 一课题作历史的回顾 一是根据某一文献末尾 所附参考文献进行追 溯 二是利用引文索。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.