好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

Google以外的17个搜索引擎创新.docx

8页
  • 卖家[上传人]:M****1
  • 文档编号:489601733
  • 上传时间:2023-09-14
  • 文档格式:DOCX
  • 文档大小:75.32KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • Google以外的17个搜索引擎创新2007年10月9日,星期二由charleschao发表有许多新的搜索引擎(最新统计有100多个)都在开创一些搜索技术的创新下面是一份17大搜索创新清单,我们认为,这些创新将来会是破坏性的(译者:关于破坏性创新,请参见这里)这些创新分为4类:查询预处理;信息来源;算法改进;结果可视化和后处理[其中的某些创新也在Google的存在各种产品中,但是,正如下文所述,Google的主搜索页中不是缺失了这些功能,就是功能还很有限查询预处理BETAhakIa@敢罰ysearchformeaninqCr)PowersetNaturalLanguagesearch这类改进的主要目的是应用逻辑来尽量预测用户的意图,并由此改进查询的输入1. 自然语言处理这一功能最初是由A开创的同期最著名的例子二者以不同的方式试图理解用户查询背后的语义或意思这些搜索引擎与Google的很大的不同,是他们认为“忽略词”(stopwords)非常重要,如次要的连词,像by,for,about,of,in等,Google通常会忽略它们2. 个人相关性(亦称“个性化”)长久以来,大家认为按某特定用户的兴趣和要求处理查询,能获得更高相关性的搜索结果。

      Google已在其搜索引擎中支持这一功能,但需要登陆才能使用很多用户理所当然地不情愿这样做,因为这样可能会给Google提供追踪其特殊的搜索内容的条件[即使JohnBattelle也认为这个想法有点可怕,尽管Google的MattCutts并不同意这个看法]所需要的就是一种虽然是匿名方式,但能提供个性化的搜索方式从更广泛的角度来说,提供多个网站上的个性化会更加有用Collarity就是拥有这一功能的搜索引擎3. 定制的、专门的搜索这是一个简单但强大的功能这一应用的典型代表是SimplyHired,—个求职招聘的垂直搜索引擎,能提供强大的、预设的搜索,比如“适合年纪大的员工的雇主”、“允许上班带狗的雇主”等信息来源retrevoJ妙呦TheUHimaleinConsumerElectronicsSearchgammasearchmash匹这些改进着重于潜在的数据来源:额外的内容类型和对数据来源的限制,提高了搜索结果的可靠性(减少垃圾信息)4. 新的内容类型今天的年轻人正像交流文字信息一样,在上舒服地交流照片和视频,成为这个时代的标记在网上,富媒体内容-图片、音频、视频、电视等,及与其内容有关的语义信息一起正在爆炸性地增长。

      搜索引擎也愈加需要相应地支持这些内容类型一些支持丰富内容的搜索引擎的示例如下:-富媒体搜索:音频(odeo,podzinger),视频(Youtube,truveo),电视(Blinkx),图片(Picsearch,Netvue)-专业化内容搜索:博客(Technorati),新闻(Topix),分类广告(oodle)当然,Google在这一领域也非常活跃,如GoogleBlogsearc(博客),Searchmash(图片),Google视频,Google新闻等,因此,也许将这一项放在这个清单里不大公平尽管如此,理想的情况是,将不同的媒体结果集合在一个搜索里,正如Searchmash已经做的那样(Retrevo是另外一个好例子)5. 限定的数据来源最使搜索用户烦心的问题之一是垃圾信息由于营销商们更加聪明,正日益使用更多侵略性的SEO(搜索引擎优化)技巧,搜索结果的质量就又下降了Google,作为最流行的搜索引擎,更是众矢之的)对一系列受信任站点的限制性搜索排除了这一问题,尽管它也缩小了搜索内容的领域—它为某些类型的搜索很好地提供了真实的、优质的结果,比如,当为一个小学项目研究火山时,搜索维基百科(Wikipedia)、国家地理(NationalGeographic)和科学/教育站点。

      这一应用最好的例子来自A,它能从多种数据来源中提供内容,并允许用户对每一个搜索作出清楚的选择GoogleCo-op和Yahoo!SearchBuilder能使第三方可以创建这种解决方案;Rollyo早已经是这一领域的先行者!6. 特定领域的搜索(垂直搜索)通过聚焦一个单一的垂直方向,搜索引擎能提供更好的用户体验,它对某一特定领域更加全面、简明针对不同的领域有令人难以置信的大量的垂直搜索引擎,更多资料请查看AlexIskold在读写网(Read/WriteWeb)上的文章或在SoftwareAbstractions博客上的概述[要更全面地了解这方面的信息,SramanaMitra的旅游服务概述介绍了垂直搜索与通用搜索的关系]算法改进这些改进着重于提高潜在的搜索算法以提高搜索结果的相关性并提供新的搜索能力7. 参数搜索这类搜索更接近于数据库查询,而不象文本搜索它回答的问题从本质上不同参数搜索有助于发现问题解决方案,而不是文本文档比如,S允许你用材料、品牌、风格或价格不同来限定衣服搜索;像indeed这样的招聘搜索网站让你限定搜索匹配的邮政编码;GlobalSpec让你搜索工程部件时指定多种参数(如搜索工业管道时输入各种参数)。

      参数搜索是垂直搜索引擎的天然特性Google已在通用层面上组合了这一特性,比如在高级搜索页面上的参数,但是冲淡了它的有用性当你深入进标准的搜索结果,或当你限定搜索某一特定垂直领域时,附加参数的强大功能最能充分体现出来8. 社会化信息输入Yahoo!的BradleyHorowitz相信社会化输入未来将是搜索技术一个重要的分水岭(微软也有同样看法)来自大量用户的聚集信息输入使搜索引擎受益于群众的智慧而提供优质的搜索结果当然,如果某些个别的输入缺乏独立性或可能是故意捣乱,搜索结果可能会无效在这一领域中提供的不同的服务中,del.icio.us是根据这一方法提供优质搜索能力的典范[在我较早发布的文章中,作了一个基于“外包给群众(crowd-sourcing)”的不同解决方案的可搜索性能的对比]其他基于用户评价的系统包括StumbleUpon,Squidoo,A,当然也有Wikipedia尽管严格来说,它们不是搜索引擎,它们都可以归结于可搜索性的总体框架之内当然,Google那功勋卓著的网页排名(PageRank)算法也隐含地根据社会化输入由于网页排名(PageRank)的一个重要组成部分是基于不同网站的外部链接的数量和特点,那些外部链接担当了收集群体智慧的隐含投票。

      9. 人工输入为了有一个完整的认识,把这一类包括进来像ChaCha这样的搜索引擎正在试验用人工操作员来回答搜索查询值得讨论,Yahoo!Answers是否也是这一领域中的另一种解决方案,尽管这些答案由其他用户,而不是为搜索引擎工作的人来提供很难看出ChaCha这类方法怎样扩大规模,除非它设法利用社区资源10. 语义搜索最近搜索领域一些令人激动的新发展与从整个网络中提取智能信息有关这些应用刚刚开始,他们表达了语义网络的巨大潜能这一领域早期的先行者包括:MonitorllO,它试图从网络上提取可作为行动参考的金融信息,金融机构投资者们可能对这些信息有兴趣;沁^,“搜人”引擎(现在正处于封闭测试阶段),它计划在启动时数据库中有1亿份档案;Riya,—个视觉搜索引擎,其技术能提供照片的面部和文本识别11. 对发现的支持与个性化和代理技术并肩的是发现技术,这是搜索的圣杯尽管即时需求的搜索现在是最流行的,但大部分用户在长时间内有相当稳定的兴趣如果你能发现新的数据源,特别是当优质的feed出现时,岂不是很爽?在这一方向上已经有了一些试探性的尝试,将搜索与RSS的力量联合起来,比如你已经能建立一个RSSfeed来输出许多Google和Yahoo!中的搜索内容。

      Bloglines已经支持“特荐Feed”的功能很明显,feed读者很适合在你感兴趣的领域推荐新的博客和feed(基于你的OPML文档的内容)这一领域中还有AggregateKnowledge,它通过从多处网站匿名收集信息来为零售和媒体提供专业化服务总体而言,这将来会是一个令人激动的领域!结果显示和后处理^rZ?3YiBJiirEdgeinRealEstatecopernic海betaQuinturaf更皿!旦这些改进着重于改善结果显示和为查询后提供的“下一步”功能12. 分类、标签云和聚类像Quintura和Clusty这样的搜索引擎根据标签和关键词提供结果的聚类它不仅让用户看到结果本身,也使结果的聚类及结果之间的关系可视化这一元信息(-information)能帮助用户领会结果并发现相关主题的新信息13. 结果可视化图片比文本结果更容易让人的大脑理解和记忆在比聚类更普遍的水平上,用专门的图形用户界面来显示搜索结果及结果之间的关系,能传达给用户更多的意义并使用户感觉到“大方向”在某一特定的上下文中,这一方法效果特别好,比女口垂直搜索弓丨擎Thinkmap的VisualThesaurus,InxightSoftware的VizServer和房地产搜索引擎Trulia的HeatMaps都是使信息可视化的新方法的例子,尽管在这一领域的研究还处于早期阶段。

      更简单的一个应用,HousingMaps是一个显示可租/售房屋位置的聚合14. 结果提炼与过滤搜索后下一步经常是通过进一步的对结果的提炼并“深入进”结果里去这不同于我们在Google已经用到的“关键词修改”,它不仅仅是用关键词组合来试验提交新的查询,而是试图确实地提炼结果[等于是在SQL查询的“where”子句中增加更多的条件],这将使用户收缩其结果并趋近于想要的答案查询提炼是搜索处理的重要部分,尽管它还没有弓起应有的注意一个好例子是医疗搜索引擎Healia,它允许用户通过使用人口特质过滤器来改动卫生保健搜索结果这很重要,因为人口特质,比如年龄、种族和性别可能对症状、疾病和治疗用药的搜索结果有很大的影响;还有基于发现结果的复杂性、来源和类型的过滤器Google最近在其结果页面底端引入了一个新按钮:“在结果中搜索”,这是正确的一步;结果还可以通过现有的OneBox插件和相关的Plusbox新功能来提炼随着时间的过去,我们可以期待这一功能会日益成熟15. 结果输出平台由于社会化媒体和内容变得更加流行,用户数字信息可选择的数量继续增加;相应地,搜索引擎必须支持多种输出平台,包括:网络搜索,移动设备,RIA(丰富互联网应用程序RichInternetApplications),RSS,电子邮件等。

      随着从不同设备接入网络更加普遍,未来的用户很可能会将更加非传统的资源来连接搜索引擎,比如:用TiVo(译者:一种可以录制数字电视节目的系统系统来搜索感兴趣的电影或节目,用Nintendo(任天堂)系统搜索游戏,甚至用冰箱的触摸屏来搜索菜谱现在的一些搜索引擎已经支持标准的网络浏览器和移动设备之外的附加的平台网络搜索引擎Plazoo提供RSSfeed已经很长时间了;Quintura起初根本就是一个可下载的RIA应用,现在这个搜索引擎刚刚开始提供网络界面为许多不同的结果类型提供支持的最简单的方法是提供开放的API,使第三方开发人员能为专业化的目标平台创建定制的用户界面Alexa网络搜索平台是最先提供开放的API的平台之一(尽管你自己承担使用该API的风险),其他可用的API包括oodle,zillow和trulia当然,Google也为几种不同的产品提供API,比如GoogleBase,GoogleMaps和AJ。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.