
显示或检索图像中的目标的方法及其装置和计算机系统的制作方法.docx
6页显示或检索图像中的目标的方法及其装置和计算机系统的制作方法专利名称:显示或检索图像中的目标的方法及其装置和计算机系统的制作方法技术领域:本发明涉及以检索为目的的在多媒体数据库中保存的图像那样的静止图像或视频图像中出现的目标的显示,特别是使用这样的显示检索目标的方法和装置背景技术: 在图像程序库的图像的应用程序中,进行视频图像或静止图像中出现的目标的轮廓及形状或目标的一部分的有效的显示和保存在用于进行附加形状库的索引和检索的众所周知的方法中,可以使用曲率标度空间(CSS)显示关于CSS的详细情况,可以在论文「利用曲率标度空间的坚固性附加有效的形状索引」(英国机器影像会报pp.53~62、爱丁堡、英国、1996年)和「利用使用诮标度空间的形状内容附加图像数据库的索引」(关于智能数据库的IEE专家会议报、伦敦、1996年)中找到两篇论文都是Mokhtarian、S.Abbasi和J.Kittler撰写的,其内容在本说明书中是作为参考文献而引用的在CSS显示中,为了得到目标的轮廓,使用曲率函数,从轮廓上的任意的点开始进行显示通过进行使形状平滑化的一连串的变形,将轮廓的形状展开,研究曲率函数此外,具体而言,就是计算与高斯滤波器的族一起卷积的曲率函数的导函数的零交叉。
作为曲率标度空间,如所周知,零交叉绘制在曲线图上但是,x轴是曲线的正规化的弧长,y轴是展开参量,特别是应用滤波器的参量曲线图上的点形成表示轮廓的特征的环构成目标的轮廓的各凸状或凹状的部分,与CSS图像的环对应在CSS图像中,最突起的环的尖峰的纵坐标用于进行轮廓的显示为了检索与输入目标的形状一致的数据库中的保存图像的目标,计算输入形状的CSS显示通过使用匹配算法语言比较各CSS图像的尖峰的位置和高度,判断输入形状与保存形状间的类似度作为关于众所周知的CSS显示的问题,有指定的轮廓的尖峰基于从轮廓上的任意的点开始进行计算的曲率函数的问题改变该开始点时,发生CSS图像的尖峰沿x轴周期地移位因此,在计算类似度测定值时,必须考虑所有的可能的移位或至少必须考虑最容易发生的移位结果,将增加检索手续和匹配手续的复杂性因此,本发明的目的旨在提供通过处理与图像对应的信号来表示出现在静止图像或视频图像中的目标的方法,该方法包括从轮廓上的任意的点开始导出与在目标的轮廓上显现的特征相关的多个数值的步骤和对上述值应用指定的分类而得到轮廓的显示的步骤最好根据上述轮廓的CSS显示导出上述值,另外,上述值最好与CSS峰值对应。
作为本发明的结果,可以不显著地降低检索精度而大幅度地降低关于匹配程序的计算发明的公开本发明的权利要求1所述的显示图像中的目标的方法是通过处理与静止图像或视频图像对应的信号来表示在图像中出现的目标的方法,其特征在于包括从目标的轮廓上的任意的点开始导出与在轮廓上显现的特征相关的多个数值的步骤和对该值应用指定的分类而得到轮廓的显示的步骤本发明的权利要求2所述的显示图像中的目标的方法,其特征在于作为结果而得到的显示与轮廓上的开始点无关地进行指定的分类本发明的权利要求3所述的显示图像中的目标的方法,其特征在于数值反映曲线上的弯曲点本发明的权利要求4所述的显示图像中的目标的方法,其特征在于通过使用平滑化参量σ按多个阶段将轮廓平滑而生成多个轮廓曲线和通过使用表示各轮廓曲线的曲率的最大值和最小值的值导出表示原来的轮廓的特征的曲线以及通过选择作为数值表示特征的曲线的尖峰的纵坐标,来得到轮廓的曲率标度空间的显示本发明的权利要求5所述的显示图像中的目标的方法,其特征在于表示特征的曲线的纵坐标与轮廓的弧长参量和平滑化参量对应本发明的权利要求6所述的显示图像中的目标的方法,其特征在于根据与平滑化参量对应的尖峰的高度的值将尖峰的纵坐标值进行分类。
本发明的权利要求7所述的显示图像中的目标的方法,其特征在于将数值从最大值开始进行分类本发明的权利要求8所述的显示图像中的目标的方法,其特征在于将数值按大小降低的顺序进行分类本发明的权利要求9所述的显示图像中的目标的方法,其特征在于将数值从最小值开始进行分类本发明的权利要求10所述的显示图像中的目标的方法是通过处理与静止图像或视频图像对应的信号来表示在图像中出现的目标的方法,其特征在于包括为了表示目标的轮廓而导出与在轮廓上显现的特征相关的多个数值的步骤和导出使用数值中的至少2个值间的关系表示显示的可靠性的系数的步骤本发明的权利要求11所述的显示图像中的目标的方法,其特征在于系数基于数值中的2个值间的比本发明的权利要求12所述的显示图像中的目标的方法,其特征在于上述比是2个最大值之比本发明的权利要求13所述的显示图像中的目标的方法,其特征在于通过使用平滑化参量σ按多个阶段将轮廓平滑而生成多个轮廓曲线和通过使用表示用于导出表示原来的轮廓的特征的曲线的各轮廓曲线的曲率的最大值和最小值的值以及通过选择作为数值表示特征的曲线的尖峰的纵坐标,来得到轮廓的曲率标度空间的显示本发明的权利要求14所述的显示图像中的目标的方法,其特征在于使用权利要求1~9的任一权项所述的方法导出上述数值。
本发明权利要求15所述的检索图像中的目标的方法是通过处理与静止图像或视频图像对应的信号来检索图像中的目标的方法,其特征在于包括用2维的轮廓的形式输入查询的步骤、使用权利要求1~9的任一权项所述的方法导出轮廓的描述符的步骤、取得使用权利要求1~9的任一权项所述的方法导出的所保存的图像中的目标的描述符并将所保存的目标的各描述符与查询描述符进行比较的步骤和根据比较而选择显示与包含表示查询与目标间的类似度的程度的对象目标的图像对应的至少1个结果的步骤本发明权利要求16所述的检索图像中的目标的方法,其特征在于使用权利要求10~12的任一权项所述的方法对于查询的轮廓和各保存的轮廓导出系数,仅使用指定的分类或使用指定的分类和与系数有关的某个其他分类进行比较本发明的权利要求17所述的显示图像中的目标的方法,是通过处理与静止图像或视频图像对应的信号来表示在图像中出现的多个目标的方法,其特征在于包括导出与在各目标的轮廓上显现的特征关联的多个数值的步骤和应用与表示各轮廓的值相同的指定的分类得到各轮廓的显示的步骤本发明的权利要求18所述的显示或检索图像中的目标的装置,其特征在于适合于执行权利要求1~17的任一权项所述的方法。
本发明的权利要求19所述的显示或检索图像中的目标的计算机程序,其特征在于适合于执行权利要求1~17的任一权项所述的方法本发明的权利要求20所述的显示或检索图像中的目标的计算机系统,其特征在于编程为按照权利要求1~17的任一权项所述的方法而动作本发明的权利要求21所述的计算机可读存储媒体,其特征在于保存用于实现权利要求1~17的任一权项所述的方法的计算机可以执行的处理本发明的权利要求22所述的显示图像中的目标的方法,其特征在于和参照附图在本说明书中说明的实际上相同,显示静止图像或视频图像中的目标本发明的权利要求23所述的检索图像中的目标的方法,其特征在于和参照附图在本说明书中说明的实际上相同,检索静止图像或视频图像中的目标本发明的权利要求24所述的显示或检索图像中的目标的计算机系统,其特征在于和参照附图在本说明书中说明的实际上相同附图的简单说明图1是视频数据库系统的框图图2是目标的轮廓的图图3是表示图2的轮廓的CSS显示的图图4是表示检索方法的框图实施发明的最佳形式下面,参照本发明的实施例实施例1.图1表示本发明的实施例进行计算机处理的视频数据库系统在该系统中,包括计算机形式的控制装置2、监视器形式的显示装置4、鼠标形式的指示装置6、包含保存的静止图像和视频图像的图像数据库8和保存在图像数据库8保存的图像中出现的目标或目标的几个部分的描述符的描述符数据库10。
表示在图像数据库的图像中出现的有兴趣的各目标的形状的描述符由控制装置2导出,保存导描述符数据库10中控制装置2根据执行以下说明的方法的适当的程序的控制而动作,导出描述符第1,对于指定的目标的轮廓,导出该轮廓的CSS显示使用上述论文之一所描述的众所周知的方法进行该CSS显示此外,具体而言,就是利用映射表现Ψ={(x(u),y(u),u∈)}表示该轮廓(其中,u是正规化的弧长参量)该轮廓通过使用ID高斯核g(u,p)进行卷积(convolve)而平滑,对于p的变化,检查展开(evolving)曲线的曲率零交叉零交叉使用表示曲率的下述公式进行特定即k(u,σ)=Xu(u,σ)Yuu(u,σ)-Xuu(u,σ)Yu(u,σ)(Xu(u,σ)2+Yu(u,σ)2)3/2]]>其中,X(u,σ)=x(u)*g(u,σ)Y(u,σ)=y(u)*g(u,σ)并且,Xu(u,σ)=x(u)*gu(u,σ)Xuu(u,σ)=x(u)*guu(u,σ)在上述公式中,*表示卷积,脚标表示导函数。
曲率零交叉的数随ρ的变化而变化,ρ非常高时,Ψ成为零交叉的凸状的曲线零交叉点(u,ρ)描绘在作为CSS图像空间的曲线图上结果,就形成表示原来的轮廓的特征的曲线于是,特定表示该特征的曲线的尖峰,并抽出对应的纵坐标进行保存通常,上述结果给出n个坐标对((x1,y1)、(x2,y2)、…(xn,yn))的组(其中,n是尖峰的数、xi是第i个尖峰的弧长的位置、yi是尖峰的高度)表示该特征的曲线的分类和位置以及对应的尖峰在CSS图像空间中出现时,与上述曲率函数的开始点有关在本发明中,尖峰的纵坐标使用专用的分类函数进行再分类利用尖峰索引{1…n}与新的集合的索引{1…n}的1对1映射T进行分类在本实施例中,纵坐标的对通过考虑y纵坐标的尺寸进行分类第1,选择最大尖峰假定第k个尖峰最突起这时,在数值进行了分类的集合中,(xk,yk)成为第1个坐标换言之,就是T(k)=1同样,其他的尖峰的纵坐标按尖峰的高度的降低顺序进行再分类在2个尖峰具有相同的高度时,具有与上述纵坐标对的x坐标最接近的x坐标的尖峰配置为第1换言之,具有原来的索引i的各纵坐标对被分配给新的索引但是,T(i)=j,并且yj>=y(j+1)。
另外,各值xi符合-xk的周期的移位作为特定的例子,从图2所示的轮廓可以得到图3所示的CSS图像的结果CSS图像的曲线的尖峰的纵坐标的详细情况示于以下的表1表1这些尖峰使用上述分类方法进行分类即,纵坐标按尖峰的高度降低的顺序进行分类另外,x纵坐标都向零的方向咬与最大尖峰的原来的x纵坐标相等的量结果,便形成示于以下表2中的进行了再分类的尖峰坐标表2利用这些进行了再分类的尖峰的纵坐标,对保存在数据10中的目标的轮廓形成描述符的数据库在本实施例中,按表2所示的分类顺序保存尖峰的纵坐标或者,也可以与表示新的分类顺序的关联的索引一起保存纵坐标实施例2.下面,说明实施例2的表示目标的轮廓的代替方法表示轮廓的CSS显示按上述方式导出但是,尖峰的纵坐标的分类与上述实施例1的分类不同此外,具体而言,第1,选择最大尖峰假定尖峰k是最突起的尖峰这时,(xk,yk)在尖峰的分类集合中成为第1个尖峰其后的尖峰对于原来的索引i的尖峰的纵坐标,成为T(i)=J并且xj<=x(j+1)另外,所有的值xi都向下方咬与原来的尖峰k的原来的x纵坐标相等的量xk换言之,在实施例2的方法中,选择最大尖峰,配置到第1位,然后,其余的尖峰按照从最大尖峰开始的原来的顺序进行配置。
以下的表3表示按照实施例2进行分类的表1的峰值的表表3在上述实施例1和2的展开中,可靠性系数(CF。
