搜索引擎基本资料
5页1、搜索引擎搜索引擎一、搜索引擎的概念一、搜索引擎的概念 搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上 的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索 服务的系统。 新竞争力通过对搜索引擎营销的规律深入研究认为:搜索引擎推广是基于网站内容 的推广这就是搜索引擎营销的核心思想。这句话说起来很简单,如果仔细分析会发现, 这句话的确包含了搜索引擎推广的一般规律。本文作者在“网站推广策略之内容推广思想漫 谈”一文中提出一个观点:“网站内容不仅是大型 ICP 网站的生命源泉,对于企业网站网络 营销的效果同样是至关重要的”。因为网站内容本身也是一种有效的网站推广手段,只是这 种推广需要借助于搜索引擎这个信息检索工具,因此网站内容推广策略实际上也就是搜索 引擎推广策略的具体应用。二、搜索引擎的分类二、搜索引擎的分类 1、全文索引全文索引引擎是名副其实的搜索引擎,国外代表有 Google,国内则有著名的百度搜索。 它们从互联网提取各个网站的信息(以网页文字为主) ,建立起数据库,并能检索与用户查 询条件相匹配的记录,按一定的排列
2、顺序返回结果。 根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的网页抓取、索 引、检索系统(Indexer) ,有独立的“蜘蛛”(Spider)程序、或爬虫(Crawler) 、或“机器人” (Robot)程序(这三种称法意义相同) ,能自建网页数据库,搜索结果直接从自身的数据 库中调用,上面提到的 Google 和百度就属于此类;另一类则是租用其他搜索引擎的数据库, 并按自定的格式排列搜索结果,如 Lycos 搜索引擎。 2、目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类 的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词 (Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的 Yahoo、新浪分类目 录搜索。 3、元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜 索,并将结果返回给用户。著名的元搜索引擎有 InfoSpace、Dogpile、Vivisimo 等,中文元 搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排
3、列搜索 结果,如 Dogpile;有的则按自定的规则将结果重新排列组合,如 Vivisimo。 4、垂直搜索引擎垂直搜索引擎为 2006 年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂 直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说 搜索、视频搜索等等) ,在其特定的搜索领域有更好的用户体验。相比通用搜索动辄数千台 检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。 5、其他非主流搜索引擎形式:1、集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索 引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如 HotBot 在 2002 年底推出的 搜索引擎。 2、门户搜索引擎:AOL Search、MSN Search 等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 3、免费链接列表(Free For All Links 简称 FFA):一般只简单地滚动链接条目,少部 分有简单的分类目录,不过规模要比 Yahoo!等目录索引小很多。 三、搜索引擎的工作原理三、搜索引
4、擎的工作原理 1、抓取网页每个独立的搜索引擎都有自己的网页抓取程序(spider) 。Spider 顺着网页中的超链接, 连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍, 理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。 2、处理网页搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要 的就是提取关键词,建立索引文件。其他还包括去除重复网页、分词(中文) 、判断网页类 型、分析超链接、计算网页的重要度/丰富度等。 3、提供检索服务用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了 用户便于判断,除了网页标题和 URL 外,还会提供一段来自网页的摘要以及其他信息。 四、全文搜索引擎四、全文搜索引擎在搜索引擎分类部分我们提到过全文搜索引擎从网站提取信息建立网页数据库的概念。 搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如 Google 一 般是 28 天) ,搜索引擎主动派出“蜘蛛”程序,对一定 IP 地址范围内的互联网站进行检索, 一旦发现新的网站,它会自动提取网站的信息和网址加入
《搜索引擎基本资料》由会员kms****20分享,可在线阅读,更多相关《搜索引擎基本资料》请在金锄头文库上搜索。
高三文科数学(长方体模型1)
高一生物:必修2 1.1孟德尔的豌豆杂交实验
遗传学第1章 绪言
高等代数课件--第三章 线性方程组§3.3 线性相关性
高二数学(1.1-1空间几何体及棱柱、棱锥的结构特征)
递回关系与演算法分析
过程是vb的基本组成单位
营养器官的生长
细菌真菌在生物圈中的作用课件(济南版七年级上)
自动化-ab变频器的原理及其应用
网络操作系统-第16章 windows server 2003安全管理
网络安全+第4讲+防火墙
素材-接触网施工技术-双线隧道吊柱安装
系统结构第5章
计算机体系结构实验2008
计算机系统安全
高考词汇总常用词v
软件测试tmap
电脑文件被删除怎么恢复图文教程
电子教案--第9章
2024-01-14 3页
2022-10-19 4页
2022-11-23 10页
2023-07-30 6页
2023-10-27 8页
2023-08-18 7页
2023-11-11 6页
2023-03-30 6页
2024-01-02 1页
2023-11-16 2页