
Internet信息资源及其检索.ppt
69页第三章 Internet信息资源 及其检索第一节 Internet信息资源检索一、 Internet信息资源 • 信息源丰富 • 信息内容多样性 • 信息表现形式多样化 • 信息时效性 • 信息交互性 • 信息关联性 • 信息开放性 • 免费信息资源丰富 • 信息组织的局部有序性与整体无序性二、Internet信息资源种类 1、按信息来源划分政府信息资源,公众信息资源,商用 信息资源 2、按信息时效划分电子邮件型信息资源,图书馆目录资 源,书目与索引资源,全文资料及电 子出版物资源,数据库信息资源3、按所采用的网络传输协议可分为:• WWW网络资源:因特网信息资源的主流,它使用http协 议,使用简单,功能强大,能方便迅速的浏览和传递分 布于网络各处的文字、图象、声音和多媒体超文本信息 • FTP信息资源:它使用ftp协议,该协议主要用于连网计 算机之间传输文件FTP相当于在网络上两个主机之间复 制文件目前仍是发布、传递软件和文件的主要方法 • TELNET信息资源:telnet是远程登陆协议telnet信息 资源包括硬件资源硬件资源和软件资源软件资源许多机构都提供远程登 录的信息系统,如图书馆的公共目录系统,信息服务机 构的综合信息系统等。
• 用户服务组资源:包括新闻组,电子邮件组等这些电 子通信组形式所传递和交流的信息资源是网络上最自由 、最具有开放性的资源news第二节 搜索引擎及其使用• 搜索引擎(search engines)是www环境 下一种信息检索的工具它利用某种软 件(如网络“蜘蛛”spiders)对互联网上的 信息进行自动跟踪和发掘,把收集到的 所有网页进行分类存储和标引,并向用 户提供查询入口用户通过这个查询入 口在浩如烟海的信息海洋中找到自己所 需的信息搜索引擎主要任务信息搜集信息处理信息查询搜索引擎分类• 1、目录式搜索引擎 • 2、搜索式搜索引擎(1)综合搜索引擎(2)专业搜索引擎 • 3、元搜索引擎目录式• 目录式搜索引擎是指把因特网中的资源服务器的地址 收集起来,由其提供的资源的类型不同而分成不同的 目录,再一层层地进行分类,形成可供浏览的树状结 构,类似图书馆的分类主题目录,用户可以不进行关 键词查询,通过层层点击浏览也可以找到所需要的信 息目录索引类搜索引擎以Yahoo雅虎为代表,国内还 有搜狐、新浪、网易等,国外有Open Directory Project (DMOZ)、LookSmart、About等。
• 其特点是由于加入了人的智能,所以信息准确、查准 率高,但是搜索范围较小,查全率低,在检索学科专 业属性特征明显的信息时利用这种方式极为方便,但 搜索引擎信息归类的质量和用户对信息类别了解程度 将直接影响到查询结果搜索(网页)型• 搜索(网页)型搜索引擎是最常见的指能够对各 网站的每个网页中的每个词进行搜索的引擎,使用 关键词(Keywords)匹配方式检索用户使用关键 词对网页进行搜索时,系统通过蜘蛛机器人自动在 选定范围内进行检索,并将所检索到的信息自动标 引导入索引数据库中,匹配所检索中的网页,并输 出匹配结果有代表性的如Google、百度、 AltaVista、AllTheWeb等搜索引擎:水平门户_综合搜索引擎[中文]中文常用搜索引擎 • 百度中文搜索引擎: • Google中文搜索引擎: • 搜狐搜狗搜索: • 雅虎: • 新浪: • 网易 : • TOM搜索: • 北大天网搜索引擎: • 奇虎 搜索引擎:水平门户_综合搜索引擎[英文]国外英文常用搜索引擎 • Google — 以搜索精度高、速度快成为最受欢迎的搜索引 擎,是目前搜索界的领军人物。
• Fast/AllTheWeb — 总部位于挪威的搜索引擎后起之秀, 风头直逼google • AltaVista — 曾经的搜索引擎巨人,目前仍被认为是最好 的搜索引擎之一 • Overture — 最著名的搜索引擎广告商,竞价排名的始作 俑者,也是全文搜索引擎 • Lycos — 发源于西班牙的搜索引擎,网络遍布世界各地 • HotBot — 隶属于Lycos Networks,搜索结果来自其他搜 索引擎及目录索引搜索引擎:垂直搜索引擎——专业搜索引 擎• 垂直搜索引擎:即专业或专用搜索引擎,它专门 用来检索某一主题范围或某一类型信息,追求专业 性与服务深度是它的特点 • 垂直搜索引擎不但可保证此领域信息的收录齐全 与更新及时,而且检索深度和分类细化远远优于综 合搜索引擎垂直搜索引擎的检出结果虽可能较 综合搜索引擎少,但 检出结果重复率低、相关性 强 、查准率高,适合于满足较具体的 、针对性 强的检索要求 目前已经涉及到购物,旅游,汽 车,工作,房产,交友等行业垂直搜索引擎举例:1找工作的搜索引擎: 比价购物搜索引擎: 博客与RSS搜索引擎: [中客] [博客中国人] [八方 ]人脉搜索引擎: [交友,找工作, 商机] [人物、软件]论坛搜索引擎: 垂直搜索引擎举例:2The Music Finder http://www.music- Singingfish(只能搜寻声音和录像) 旅行TripAdvisor 图像搜索引擎: [图像词典]商业搜索引擎 Business 生意定向搜索引擎。
DailyStocks 可以了解被查询公司存货的信息已经相关的新闻报导,研究, 引述和其他 数据 FMLX 英国定向的关于公司,存货数据,分析和研究的搜索引擎 eBizSearch http://www.ebizsearch.org 关于电子商务的文章和报告RSS源[RSS feed]搜索引擎•单个站点: 新华网: 天极网: 计世网: 网典: •搜索引擎:中文RSS搜索引擎: 八方搜索引擎 博客中国 [feed,订阅数据源和单篇] 看天下 [feed,订阅数据源] 看天下搜索引擎: [单篇] RSS Search Engine 周博通RSS导航 综合搜索引擎的专门化趋势:•GOOGLE 学术搜索: GOOGLE 图书搜索 •Google图片搜索 AllTheWeb [能专门对图像、多媒体信息] •搜狗(Sogou) [人物、音乐、购物、图片、地图] 天网 • 星空搜索 • FTPSearch邮件列表搜索引擎• 万维网联盟邮件列表检索服务 http://www.w3.org/search/mail/public • Catalist • Title BT搜索引擎• BT特工 • BT @ China 联盟 • 飞客BT搜索引擎 • 贪婪大陆-动漫搜索频道 • BT下载工具: • BT资源: • BT @ China 联盟搜索引擎:射 手网(字幕下载) • 电骡emule…元搜索引擎(Meta Search Engine)• 这类搜索引擎没有自己的索引数据,它将用户的查询 请求同时向多个搜索引擎递交,将返回的结果进行重 复排除、重新排序等处理后,作为自己的结果返回给 用户。
如万纬搜索、Search、Dogpile等优点:能同时搜索多个搜索引擎,能在一定程度上提高 查询的广度缺点:因为有时候并不能对一个搜索引擎全部查完,有 时后也会漏掉一些重要信息• 早期的中文元搜索引擎 1、metaFisher中文元搜索引擎 有现代主流搜索引擎的界面风格 2、万纬搜索 功能上和 第一个元搜索引擎一样,核心功能很弱,制作一般 3、多元搜索 合的搜索引擎最多,但实际使用效果很差,查询速度也慢, 返回结果基本未作处理 • 新近出现的元搜索引擎 1、一家搜 色 2、bbmao 是国内唯一具有自动聚 类功能的元搜索引擎,技术和功能上都比较强 3、狠搜 时提供商业信息搜索,核心功能一般更多元搜索引擎(英文)• MetaCraw。
