好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第二课因特网信息的查找——搜索引擎课件.ppt

23页
  • 卖家[上传人]:大米
  • 文档编号:591408310
  • 上传时间:2024-09-17
  • 文档格式:PPT
  • 文档大小:797.50KB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 复习信信息息获获取取的的一一般般过过程程定位信息需求定位信息需求选择信息来源选择信息来源确定信息获取方法,确定信息获取方法,获取信息获取信息评价信息评价信息如何通过因特网获取信息 信息获取一般过程WhenWherewhat文献型口头型电子型实物型直接法间接法权威性准确性客观性时效性信息获取典型案例 因特网信息的查找 常用的因特网信息检索方法常用的因特网信息检索方法分类使用方法直接访问网页使用搜索引擎查询数据库知道信息所在网页的地址或网络实名,可快捷地检索到结果利用分类目录或关键词,在特定的搜索引擎中查找所需的信息利用网上的数据库进行查询 搜索引擎(搜索引擎( Search Engine ))搜索引擎是指专门用于搜索引擎是指专门用于因特网信息因特网信息查找查找的网络工具的网络工具资料:搜索引擎是何时产生的呢? 就是在就是在InternetInternet上执行信息搜索的专上执行信息搜索的专门站点,它们可以对主页进行分类与搜门站点,它们可以对主页进行分类与搜索如果输入一个特定的搜索词,搜索索如果输入一个特定的搜索词,搜索引擎就会自动进入索引清单,将所有与引擎就会自动进入索引清单,将所有与搜索词相匹配的内容找出,并显示一个搜索词相匹配的内容找出,并显示一个指向存放这些信息的连接清单。

      指向存放这些信息的连接清单 一、搜索引擎发展史 1990年以前,没有任何人能搜索互联网万维网还没有出现,人们通过FTP来共享交流资源,但是由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便 应运而生 1990年,加拿大一所大学的师生想到了开发一个可以以文件名查找文件的系统,于是便有了Archie 这个系统被认为是现代意义上的搜索引擎的祖先 由于Archie深受用户欢迎,美国一所大学于1993年开发了相似的搜索工具Gopher,不过此时的搜索工具除了索引文件外,已能检索网页 当时电脑“机器人” 是指某个不间断地执行某项任务的软件程序软件程序由于专门用于检索信息的“机器人”程序象蜘蛛一样在网络间爬来爬去,因此,搜索引擎的“机器人”程序就被称为“蜘蛛”程序  随着互联网的迅速发展,一些编程者将传统的“蜘蛛”程序工作原理作了些改进其设想是,既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网崭露头角 现代意义上的搜索引擎——大家现在熟知的Lycos出现于1994年7月飞速发展趣味小资料:不经意中诞生的雅虎 同年4月,斯坦福大学的两名博士生,David Filo和杨致远共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。

      从此搜索引擎进入了高速发展时期 目前,互联网上有名有姓的搜索引擎已达数百家,其检索的信息量也与从前不可同日而语比如最近风头正劲的Google,其数据库中存放的网页已达30亿之巨! 二、搜索引擎的工作原理 搜索引擎是对互联网上的信息资源进行搜集整理以供用户查询的系统,它包括信息搜集、信息整理建立索引数据库和用户查询三部分 网网络络用户系统用户系统检索代理软件检索代理软件数据库数据库database巡视程序巡视程序(或人工采集)(或人工采集)搜索引擎的工作原理搜索引擎的工作原理 •元搜索引擎元搜索引擎:辅助工具:辅助工具三、搜索引擎的类型•全文搜索引擎全文搜索引擎:关键词检索:关键词检索•目录索引类搜索引擎目录索引类搜索引擎:分类目录检索:分类目录检索搜索引擎按其工作方式主要可以分为: 小结:两类搜索引擎的比较类型搜索方法适用范围全文搜索引擎目录类搜索引擎本课练习搜索引擎将不断收集到的网页及网址以数据库的形式组织存贮查询时用户输入关键词,搜索引擎便会从数据库中检索与之匹配的相关记录,按一定的排列顺序返回给用户搜索引擎收集,整理信息,以分类目录的形式链接起来,供用户检索,用户通过逐级层层点击浏览这些目录,寻找自己所需的站点信息。

      可提练关键词的明确信息基本原则是:构建关键词时,我们尽量不要用自然语言 某一类的主题信息 1、通过网络了解著名搜索引擎、通过网络了解著名搜索引擎“yahoo”的诞生过程的诞生过程2、、味味精精是是调调味味料料的的一一种种,,请请问问它它的的鲜鲜味味来来自自哪哪一一种种物物质质,,它最早发现于什么汤中?它最早发现于什么汤中?3、、我我们们生生活活的的城城市市扬扬州州是是个个历历史史悠悠久久的的城城市市,,在在中中国国历历史史上上,,扬扬州州曾曾有有过过三三次次鼎鼎盛盛时时期期,,请请列列出出三三个个时时期期4、、位位居居世世界界第第二二的的高高峰峰是是什什么么??位位居居世世界界第第二二的的洼洼地地又又是什么?它们之间的高低落差多少米?是什么?它们之间的高低落差多少米?课堂实践:因特网信息的查找请将搜索的结果以请将搜索的结果以wordword文件的形式上传至文件的形式上传至FTPFTP服务器服务器上 1、全文搜索引擎(关键词索引)w使用使用自动索引软件自动索引软件来发现并标引网页,来发现并标引网页,建立数据库建立数据库它的它的SpiderSpider自动在因特网上漫游,不断搜集各类新网自动在因特网上漫游,不断搜集各类新网址及网页,形成数以千万乃至亿万条记录的数据库;址及网页,形成数以千万乃至亿万条记录的数据库;w它它以以WebWeb形式形式提供给用户一个提供给用户一个检索界面,检索界面,供用户输入供用户输入检索检索关键词关键词( (词组或短语等检索项词组或短语等检索项) ),,以其特定的检索以其特定的检索算法找出相关记录,按相关度排序输出。

      算法找出相关记录,按相关度排序输出w 关键词关键词 就是您输入搜索框中的文字就是您输入搜索框中的文字 例1、1982年世界杯足球赛冠军得主是谁? w例2:地震又称地动、地振动,是地壳快速释放能量过程中造成振动,期间会产生地震波的一种自然现象多少级以上的地震会造成破坏? w a)4.5级 b)5级 c)6级关键词: 震级 造成破坏 例例3::请问位居世界第二的高峰是什么?位居世请问位居世界第二的高峰是什么?位居世界第二的洼地又是什么?你知道它们之间的高低界第二的洼地又是什么?你知道它们之间的高低落差是多少米落差是多少米? 全文搜索引擎的优缺点优点:优点: w收集、加工信息的范围广、速度快,能及时地提收集、加工信息的范围广、速度快,能及时地提供新增信息给用户供新增信息给用户 w每个搜索引擎都提供了多种检索功能每个搜索引擎都提供了多种检索功能 ,有利于提,有利于提高检索效率高检索效率w适合于检索特定的信息及较为专业、具体或类属适合于检索特定的信息及较为专业、具体或类属不明确的课题不明确的课题w缺点缺点:一次检索输出的结果可能很多,但当中包:一次检索输出的结果可能很多,但当中包含了许多重复、虚假的信息含了许多重复、虚假的信息 ,因此要过滤一大堆,因此要过滤一大堆与检索主题互不相干的检索结果。

      与检索主题互不相干的检索结果建议在结果中进(建议在结果中进行二次检索)行二次检索) 2、目录索引类搜索引擎w 一般采用一般采用人工方式人工方式采集和存储网络信息,是由采集和存储网络信息,是由专业人员在广泛搜集网络资源,进行加工整理,专业人员在广泛搜集网络资源,进行加工整理,按按照某种主题分类体系编制照某种主题分类体系编制的一种可供检索的的一种可供检索的等级结等级结构式目录构式目录 w 在每个目录大类及其子类下提供相应的网络资在每个目录大类及其子类下提供相应的网络资源站点地址,并附有简单的介绍源站点地址,并附有简单的介绍w 用户能在目录体系的引导下,通过浏览目录,用户能在目录体系的引导下,通过浏览目录,逐级查找,检索自己感兴趣的主题逐级查找,检索自己感兴趣的主题w 目录索引类搜索引擎例: 查找上海的相关旅游信息 目录索引类搜索引擎的优缺点优点:优点:w 查准率较高查准率较高(查全率较低)查全率较低)w 适合查找综合性、概括性的主题概念,或对适合查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。

      检索准确度要求较高的课题缺点:缺点:w 专题指南的局限性在于其信息更新速度慢,专题指南的局限性在于其信息更新速度慢,跟不上网络信息的发展跟不上网络信息的发展 w 数据库的规模相对较小,收录的网页数量和数据库的规模相对较小,收录的网页数量和深度都相对不足,比较容易遗漏交叉相关信息深度都相对不足,比较容易遗漏交叉相关信息 3、元搜索引擎、元搜索引擎 w元搜索引擎没有独立的索引数据库,在接受查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户w在这里,“元”(Meta)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用w元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.