好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

图像搜索引擎的进步与应用现状分析.docx

9页
  • 卖家[上传人]:杨***
  • 文档编号:305325640
  • 上传时间:2022-06-07
  • 文档格式:DOCX
  • 文档大小:28.88KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    •     图像搜索引擎的进步与应用现状分析    Reference:本文通过多方面的文献总结与大量的搜索试验,介绍了图像搜索引擎检索原理的发展进程然后配以典型示例尤其是视觉搜索的应用作分析,评介各种检索原理的优劣,再进一步分析图像搜索引擎在专业领域的应用状况,以发掘图像搜索引擎的垂直应用领域与发展方向Keys:视觉检索 图像搜索 应用据搜索日志分析的研究表明,用户对图片信息的需求越来越大,单纯的文字搜索已经逐渐地向图文并茂的搜索结果发展[1]本文首先介绍图像检索原理的进步历程,然后分析比较各检索原理在实际图像搜索引擎和各专业领域的垂直应用情况1. 图像检索原理进展研究1.1 目录式图像检索目录式检索是将图片进行分类,用户按照分类结构逐渐细化查询范围目录式检索方式经常需要人工来进行大部分的分类工作,因此效率较低现在仍有大部分的图像搜索引擎结合关键字搜索保留了这一检索途径,但类目也通常限于大众用途的图片,这些类目下的图片主要源自专题网站,如壁纸就多来源于专门的壁纸网站1.2 Keys图像检索Keys图像检索原理是基于图像外部信息的检索,这种方式是根据图像的文件名、路径名、链路、ALT标签及与图像在同一页面的文本信息等外部信息进行检索,实质上是将图像检索转化为文本检索,这是目前搜索引擎普遍采用的方法[3]。

      这种检索方式最显著的优点是检索速度快,很好地利用了成熟的基于文本的检索技术不足在于过于依赖网页标题与文件名的准确性以上两种检索方式可归结为基于文本的图像检索(Text based Image Retrieval,TBIR) [4],它们往往只分析图像的外部信息即文本信息,而没有考虑图像本身的视觉信息随着图像数量的大量增长,语言表达的限制性及语种的复杂性,这种只是基于文本的图像检索技术已经不能满足用户的需求,于是有了基于图像内容检索技术(Content.based Image Retrieval,CBIR) [2]的发展1.3 视觉图像检索基于内容的图像检索技术主要就是图像视觉检索,将图像自身的视觉内容特征作为其索引,如颜色、纹理、形状以及空间关系等底层视觉特征,通过对这些图像特征的比较来实现检索[5]这是一种基于图像本身特征层次的自动匹配,融合了图像理解、模式识别和计算机视觉等理论,特别适用于检索目标明确的查询视觉图像检索原理在实际应用中有两种检索方式:层次性和实例式层次性图像搜索是将关键字检索与简单的视觉图像检索相结合,不再是“Keys+Keys+…”的过程,而是将Keys与某些主要的视觉特征由用户自由组合。

      实例式图像检索在较新的专业图像搜索引擎中应用较多,该方法是提供一张图片实例或者由用户绘制一个大概的形状,系统自主综合可视特征寻找相似图片[6]不过,有时候需要用户提供图片实例会使系统变得很不友好,因此通常有实例式图像检索功能的搜索引擎也包含层次性图像搜索功能2. 图像搜索引擎应用各检索原理状况分析早期,大多数图像搜索引擎就已经支持分类目录浏览和Keys检索两种检索方式,随着研究的深入在20世纪90年代就已提出的基于图像内容的检索技术终于得到了较好的实现表1 各图像检索原理应用代表主要阶段 检索原理 应用实例 评价 基于文本的图像检索 目录式 Google、Yahoo等综合性的图像搜索引擎 需人工标引,效率低,不适宜海量图片检索,对于查找某一类目录的大量图片十分有效 Keys 大部分搜索引擎的主要方式 检索速度快,操作简单,依赖网页标题与文件名的准确性 基于图像内容的图像检索 层次性 Google、Bing等高级图片检索、Picitup、Picsearch 可不断地调整与细化需求,更快地找到满意图片,适用于较低要求的图片搜索 实例式 Gazopa、Retrievr、TinEye 以图像底层特征和显著颜色的相似性匹配为基础,图像高层内容特征为辅,对于高层内容特征目前无较好表现 2.1 基于文本检索的搜索引擎应用分析目录式图像检索方式在用户有意寻找某一大类的图而具体要求又不高时比较适用。

      Google、Yahoo等综合性商业搜索引擎均设有目录分类,类目涉及当前需求量大的如明星、动漫、壁纸、风景等大类比较著名的目录如由哥伦比亚大学开发的Webseek,通过自动与手工结合的方法,创建了按照字顺排序包含了20余大类近百小类的极为丰富的类目体系至于Keys图像检索原理,这种符合人们一贯检索的使用习惯,因其易用性再配合初级视觉检索方式,被大多数商业Web图像检索,如Google、Yahoo、Baidu等作为主要图像检索途径,且其性能通过一些网络分析技术的过滤已得到大幅提高2.2 基于图像内容检索的搜索引擎应用分析Google——提供了包括尺寸、类型(如脸部特写、剪切画等)、颜色等更细化的查找图片途径,在高级搜索里还可以就图片所在站点、图像纵横比例、格式、授权等方面进行过滤在结果界面可以通过点击“查找相似图片”找到与原图片风格、场面背景相近的图片在众中图像搜索引擎中,Google图片搜索是较好地结合了网页文本和图像视觉的综合图像搜索引擎Picitup——首次明确提出“层次性搜索”的概念,除了关键字检索,还专门提供动画、彩色、黑白、人像、风景、四方(即图片比例)等常用的选项供用户筛选图片。

      Gazopa——提供三种图片搜索方式:Keys搜索、上传图片搜索相似图片或者用户画图来搜索[7]实例式检索到图像后,Gazopa还可以再根据颜色、形状、尺寸、时间、人脸等再过滤除了搜索图片以外,它还可以用图片搜索具有相似画面的视频Retrievr跟Gazopa有所不同,它的特色是没有设置Keys搜索方式,甚至没有提供文字输入框,只有绘画框、上图传图片框和输入URL的地方TinEye——通过图片来查找网页,可以非常精确地在整个互联网上匹配用户要查找的目标图像,而且搜索速度快在TinEye的框内上传图片或者输入图片的URL地址,能很快地找到与所提供图片一样的未经处理的图,这样就能很轻易地查明一张图在网络上具体的使用情况总之,对于普通性要求的图像检索,结合文本和视觉的图像检索是比较普遍和实用的选择,而对于检索目标更为明确或是有专业需求的用户来讲,视觉检索被需要得更多Google图片搜索普遍用户体验较好,除了它的图库数量巨大,还因为它在图像语境分析与图片视觉的有效理解与结合方面做得相对较好3. 图像搜索引擎在专业领域的应用分析为满足Internet用户需求的长尾,除了综合性图像搜索引擎,图像搜索引擎技术的进步在某些专业领域也引起了重视,我们称之为垂直应用。

      3.1 电子商务领域电子商务的发展离不开图像检索技术,早期主要是基于文本的检索方式,随着市场的发展近几年也出现了利用视觉搜索的服饰类电子商务网站L最早将视觉图像搜索技术应用于电子商务它分为后端索引系统和前端检索系统 [8]后端系统离线处理图像,利用图像分析技术将产品图像从背景中分离出来,然后提取一些形状、颜色、纹理等可视化特征及文字特征前端系统执行搜索,可按关键字、导航目录和词条搜索,同时也可以进行相似图片检索Like的视觉搜索体验较好,能快速找到很多高度相似并符合需求的商品在我国,视觉搜索在电子商务领域应用的相关研究虽不少,但应用尚处于测试阶段,如搜图购搜图购的搜索方式主要是看图搜图和实例式图片搜索,但搜图购的技术跟Like相差较远,可搜索的商品种类也有限在试验结果中常有出现男女服装不区分,服装类别差异过大等情况3.2 图形设计领域在图形设计领域,用户经常会需要用到已有的设计元素即图标FindIcons是全球最大的图标搜索引擎,目前有2,234个图标集,299,964个图标它采用层次性搜索,先利用Keys检索到图标,然后用户可以通过背景色、尺寸、颜色、风格、授权等要求进行更细化的筛选。

      3.3 人脸识别在2006年,瑞典公司Polar Rose AB就开发了在搜索软件中加入面部识别技术的方式,通过采用3D模式解析脸部图片,将人的脸部统计出多个不同的特征在前面提到过的Xcavator、Picitup、Gazopa、Google等都有脸形匹配或是以人物个数为检索图片的筛选项目前人脸识别的理论方法非常多,相信随着技术与相关规定的成熟,这项应用终将发挥很大的作用3.4 医药领域许多的医学和健康的相关专业需要使用到如x光、扫描影像之类的可视信息资料,用于诊断和检测疾病图片检索技术能够有效的用于这类信息的表示、存储、传输和分析,针对该领域的研究主要集中在图像处理上,例如边界或者特征检测,可用于跟踪肿瘤的生长[6]该领域已经有成功的使用案例如Public Health Image Library另外,在出版、建筑设计、天文学、地理学、历史研究、音乐搜索等各种领域图像搜索引擎也正被利用或试验总之,图像检索会随着视觉检索技术的发展得到更广泛更深入的应用结语从图像搜索引擎的检索方式进步来看,图像搜索仍然存在较多需要解决的问题:1)查准率低;2)收录范围有限;3)版权问题从图像搜索引擎的应用情况来看,综合图像搜索引擎要考虑到普通用户的需求,要做到检准率、速度、易用性并重,因而基于文本的图像检索仍为大众所需要;对于专业图像检索,目前视觉内容特征判别方向相对简单,并且在不同的应用领域,对各个判别角度的准确性要求不一致,要做到更精准更智能,除了技术的发展,对用户需求的把握也要求同步发展。

      Reference:[1] 余慧佳,刘奕群,张敏,茹立云,马少平. 基于大规模日志分析的搜索引擎用户行为分析. 中文信息学报[J],2007(1).[2] .[3] 陈立娜. 因特网上的图像搜索引擎. 情报理论与实践[J],2001(4).[4] Jeffrey RB, Charles F, Amarnath G,et a1. “Virage image search engine:an open framework for image management”. In Symposium on Electronic Imaging:Science and Technology - Storage and Retrieval for Image and Video Databases IV[DB/OL], 1996.[5] http://en.wikipedia.org.[6] 谢东升. 基于文本的图片搜索引擎的研究. 学位论文[D],2007.[7] .[8]谢琳. 基于内容和情感的层次化商品图像检索研究. 学位论文[D],2009.[9] .hk/imgcat/imghp?hl=zh-CN.[10] [11] [12] http://aa-lab.cs.uu.nl/cbirsurvey/cbir-survey/node44.html.[13] [14] [15] [16] http://labs.systemone.at/retrievr/.[17] [18] [19] http://www.xcavator.n。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.