好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

《信息资源检索(第二版)》教学课件—第七章网络信息资源检索.ppt

37页
  • 卖家[上传人]:sat****105
  • 文档编号:317845707
  • 上传时间:2022-06-26
  • 文档格式:PPT
  • 文档大小:933KB
  • / 37 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第章第章网络信息资源检索网络信息资源检索目目 录录. .网络信息资源概述网络信息资源概述 .网络信息资源的概念 .网络信息资源的类型 .网络信息资源的特点 .网络信息资源的评价 . .网络搜索引擎的利用网络搜索引擎的利用 .搜索引擎概述 .常用搜索引擎简介 .网络信息资源概述o.网络信息资源的概念网络信息资源的概念o网络信息资源是指以电子数据的形式将文字、图像、声音、动画等多种形式的信息存储在光磁等非纸张载体中,并通过网络和计算机等方式再现出来的信息资源网络信息资源的类型o.按照信息资源传播的范围可大致分为光盘局域网信息、传统的联机网络信息和现在广泛使用的网络信息资源o.按照信息加工层次可分为网络指南搜索引擎、联机馆藏目录、网络数据库、电子期刊、电子图书、电子报纸、参考工具书和其他动态信息o.按照提供信息的机构可将信息资源分为图书馆提供的信息资源、专业信息服务机构提供的信息资源、政府部门提供的信息资源、企业公司团体甚至个人提供的信息资源o.按照信息内容的表现形式和用途可分为全文数据、事实型数据、数值型数据、文献书目信息、实时交互活动型信息以及图像音乐等nWWW网络资源nFTP信息资源nTELNET信息资源n用户服务组资源(包括新闻组,电子邮件组等)n广域信息服务器WAISnGopher 按信息传播采用的网络传输协议划分:按信息传播采用的网络传输协议划分: 按信息内容的表现形式和内容划分按信息内容的表现形式和内容划分n全文型信息:它指直接在网上发行的电子期刊,网上报纸,印刷型期刊的电子版,网络学院的各类教材,政府出版物,标准全文等; n事实型信息:天气预报,节目预告,火车车次,飞机航班,城市或景点介绍,工程实况、IP地址等; n数值型信息:主要是指各种统计数据; n数据库类信息:如DIALOG,万方等,是传统数据库的网络化; n微内容(web2.0特征):如博客、播客,BBS,聊天,邮件讨论组,网络新闻组等。

      n其它类型:投资行情和分析,图形图象,影视广告等 资源集合资源集合 Collection资源集合是个体资源对象的集合 数据集数据集 Dataset是指为便于计算机直接处理而以特定结构进行编码的信息 事件事件 Event指基于时间的、非永久存在的一种出现例子有:展览会、网站广播、会议 图像图像 Image图像是不同于文本的一种主要的符号视觉表现包括电子的和物理的两种表现形式 交互资源交互资源 Interactive Resource是一种需要和用户交流而获得理解,运行和体验的资源 DCMI对网络信息资源的划分与描述 服务服务 Service是提供一种或多种有价值的功能给最终用户的系统 软件软件 Software软件是一种以源代码或编译形式存在的计算机程序,可以永久安装在其他计算机上 声音声音 Sound声音是一种主要用来生成音频的资源 文本文本 Text文本是一种内容主要用来阅读的资源 物理对象物理对象 Physical Object物理对象是指一种没有生命的三维对象或物质 .网络信息资源的特点o.以网络为传播媒体o.以多媒体为内容特征o.以现代信息技术为记录手段o.数据结构具有通用性、开放性和标准化o.具有高度的整合性,便于多种媒体一体化o.交互性能增强.网络信息资源的评价o所谓网络信息资源评价,就是根据确定的网络信息资源评价指标体系来测定评价对象,即网络信息资源(包括网站资源、网页资源等)的各方面的属性,以全面、综合地掌握评价对象的基本情况。

      简而言之,网络信息资源评价就是对网络信息资源进行考核 评价的框架评价对象WEB资资源源引进数字资源引进数字资源评价的评价的指标体系指标体系评价模式评价模式评价目的 评价的目的n对信息接收者来讲:对信息接收者来讲:n尽快找到想要的信息n不想让无用信息和错误信息干扰n对信息发布者来讲对信息发布者来讲n能够吸收更多核心信息接收者的光顾n将最想表达的信息清晰地、准确地表达出来n对信息组织管理者来讲对信息组织管理者来讲n方便用户准确、及时地获取信息n确定、收集和组织核心网络信息资源 评价对象l(1)网页信息 即网页上的具体内容,包括信息内容属性和存在形式、状态、附件等外部属性l(2)网站.网络信息资源评价的重要意义o()网络信息资源评价是网络信息资源组织的重要前提o()网络信息资源评价是网络信息资源有效利用的重要依据o()网络信息资源评价是网络信息资源质量提高的重要保障网络资源评价指标体系o()网络信息资源的核心评价指标:权威性、准确性、全面性、新颖性、唯一性o()网络信息资源的参考评价指标:网页设计指标、用户使用指标 评价的步骤评价的步骤 o(1)确定评价对象o(2)运用“网络信息资源评价指标体系” o(3)将评价结果按照综合得分高低进行排序,并写出简单的评价报告o(4)收集用户的反馈信息。

      参考专家学者等他人的意见等进行修正或核实,以对评价对象进行再一次的评价举例:评价各级政府网站举例:评价各级政府网站 o部委类网站部委类网站,包括国务院部委、直属(办事)机构(单位)、部委管理的国家局网站,共74家;o省级政府网站省级政府网站,包括新疆生产建设兵团网站,暂不含港澳台网站,共32家;o计划单列市、副省级省会城市、地市级政府网站计划单列市、副省级省会城市、地市级政府网站,共333家;o区县政府网站区县政府网站,包括直辖市、计划单列市和省会城市所辖区县的政府网站,共443家;评价结果o(5)评价结果 .网络搜索引擎的利用 搜索引擎 是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统搜索引擎的基本工作原理o()全文搜索引擎基本工作原理o()目录索引 全文检索系统和搜索引擎比较全文检索系统和搜索引擎比较 类别全文检索搜索引擎信息获得信息获得比较容易,被检索内容基本上都是规范化信息.信息获得困难,特别是信息提取的准确率受算法影响很大.信息总量支持的信息总量较少,搜索速度受信息总量增加而递减.支持几十亿到几百亿的信息总量,搜索速度和信息总量基本无关.分词技术分词准确性较高,分词速度中等,搜索结果比较满意.词库更新慢.分词速度极快,分词准确性中等.新词补充及时.存储索引索引结果硬盘存储,系统内存消耗较少,可和其他程序并存.索引结果,以内存存储为主,硬盘存储为辅, 大多独占操作系统.搜索耗时搜索用时为秒级,只支持小用户量并发.搜索用时可达到毫秒级,拥有超强并发处理能力.搜索结果搜索结果准确,结果总数为实际数目, 搜索结果能准确重现.结果不够准确,只提供全部结果的前面部分, 搜索结果不保证重现.系统规模系统简单,服务器硬件投入较少,硬件管理比较轻松.系统庞大,服务器硬件投入巨大,几百台服务器到几十万台服务器.搜索引擎提供的检索功能o()目录与关键词检索相结合o()精确检索o()自然语言检索o()多语种检索o()多媒体检索o()过滤检索o()智能检索o()检索结果修正o()检索结果排序o()提供最新收录的新站点.常用搜索引擎简介o百度oGoogle o雅虎 o搜狗 o腾讯搜搜 .百度o()百度简介()百度简介o百度是全球最大的中文搜索引擎、最大的中文网站,2000年月创立于北京中关村。

      o()百度基本搜索方式:百度一下()百度基本搜索方式:百度一下o()百度特色功能:百度快照、相关搜索、()百度特色功能:百度快照、相关搜索、拼音提示、拼音提示、 错别字提示、英汉互译词典、错别字提示、英汉互译词典、计算器和度量衡转换、专业文档搜索、股票、计算器和度量衡转换、专业文档搜索、股票、列车时刻表和飞机航班查询、高级搜索、天列车时刻表和飞机航班查询、高级搜索、天气查询气查询2.Google 2.Google o()()简简介介oGoogle是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月在美国硅谷创建的高科技公司,他们所设计的Google搜索引擎,旨在提供全球最优秀的搜索引擎服务,通过其强大、迅速而方便的搜索引擎,在网上为用户提供准确、详实、符合他们需要的信息Google自2000年正式开始商业运营以来,目前在全球范围内已拥有了一个正在快速增长的忠实用户群,其中一半以上是国际用户Google公司不但拥有自身的独立搜索引擎网站,现今的日访问量高达7000万次,还将其搜索引擎技术售卖给世界上许多公司,目前就有包括雅虎、美国、网景和中国的网易等知名网站在内的全球150多家公司采用了Google搜索引擎技术。

      oGoogle 是由英文单词“googol”变化而来googol”是美国数学家 Edward Kasner 的侄子 Milton Sirotta 创造的一个词,表示 1 后边带有 100 个零的数字Google 使用这个词代表公司想征服网上无穷无尽资料的雄心ohttp:/ Filo)和美籍华裔杨致远(Jerry Yang)编制的Internet站点目录,1995年成立了Yahoo!公司如今,Yahoo!不仅是一个以分类目录、网站检索为主,附带网页全文检索的搜索引擎,还推出了许多其他的网上服务项目,如聊天、拍卖、购物、股市行情、网上商店,个人免费电子信箱、游戏等 Yahoo!主页主要包括搜索输入框、分类目录以及网上商店(Shop)、查询(Find)、沟通(联系Connect)、工具(Organize)、休闲(Fun)、资讯(Info)6个频道34个栏目的网络服务链接等 目前,雅虎在世界各地相继建立了24个国际站点,除了英文、中文以外,还有日、韩、法、德、意、西班牙、丹麦等10余种语言版本,但各版本的内容互不相同,可以说,每个版本都是一个不同的、相对独立的搜索引擎如英文版主要收录英文网站,日文版主要收录日本及日文网站等,雅虎英文版除主站外,又有多个地区分站,如亚洲站Yahoo in Asia、加拿大站Yahoo! Canada 等,这些分站以收录这一地区的英文网站为主,也可视为独立的搜索引擎。

      雅虎中文版共开设了四个网站,雅虎中文:(简体);(繁体);雅虎中国:(简体);雅虎台湾:(繁Yahoo! Yahoo! 检索方法检索方法o Yahoo!提供简单检索和高级检索两种搜索方式简单检索就是Yahoo!的主页在任一个返回的查询结果页的顶部和底部,都有一个检索输入框可以在输入框内输入想要找的检索词或检索式,单击右侧的“Search”按钮后,返回的是一页与检索词匹配的记录列表,最前面的是Yahoo!目录链(Category),其后分别是以链接形式出现的Yahoo!网站标题(Title)、简介(Description)和URL如果在Yahoo!目录和网站中都没有相匹配的内容,Yahoo!则自动利用其内置的查询机制进行整个WEB范围的文档查找 Yahoo!高级检索可构造更精确的检索要求,得到更具体的检索结果单击Yahoo!主页上“Search”按钮右侧的“Advanced Search”链接,进入高级查询选项设置页面(Search Options) o在高级检索界面,输入关键词后在右侧的选择框中选择检索的范围Yahoo!索引库(基本检索中默认的检索范围)、新闻(News)、新闻组(Usenet)、拍卖(Auction)或黄页(Yellow Pages)等,如果用户选择了在Yahoo!索引库中进行检索,那么可以在“Select a search method:”标题下方指定搜索模式,在“Select a search area”下方指定搜索区域范围。

      另外,还可以在“Find only new listings added during the past”处指定对返回结果的时效限制,在“After the first result page ,display matches per page”处确定每页返回多少个匹配的网站或分类o在该检索界面,输入关键词后在右侧的选择框中选择检索的范围Yahoo!索引库(基本检索中默认的检。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.