好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

目标表达和描述技术.pdf

91页
  • 卖家[上传人]:豆浆
  • 文档编号:5700174
  • 上传时间:2017-08-31
  • 文档格式:PDF
  • 文档大小:926.24KB
  • / 91 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章目标表达和描述技术概述◆ 图像分割实现了把图像中具有不同灰度特征、不同组织特征和不同结构特征的区域分离开的功能而在实际中对其进一步的分析还包括:利用数字、文字、数学公式、某些符号体系等,对感兴趣的目标(泛指人们感兴趣的某些区域)的几何性质进行定性或定量的表示和描述 目标表达和目标描述通过图像分割可得到图像中感兴趣的区域,即目标先需要将目标标记出来,这时主要考虑目标像素的连通性在此基础上,可以对目标采取合适的数据结构来表达,并采用恰当的形式描述它们的特性目标表达是直接具体地表示目标,目标描述是较抽象地表示目标特性要求:节省存储空间、方便特征提取n 链码的表达n链码归一化处理处理n形状数n 轮廓线段的近似表达n边界标记的表示n 目标的骨架表达n 运动表达链码表示1、问题的提出由于:平面曲线上一点的斜率可以用曲线在该点的切线和水平坐标轴夹角的正切来表示所以:图像中的弧线上任一点的斜率也可以用该点到弧线上该点的邻点的方向来定义,也即用角度而不是角度的正切来表示斜率的大小2、基本思想用矩形网格采样图像,对于图像中曲线中的一段直线段来说,就可以用一对数字描述它的两个信息:一个是该线段在起始坐标点的斜率信息;另一个是该线段从起始点坐标开始,并在该坐标点斜率方向延续了几个坐标长度的信息。

      或者化简为用长度函数的斜率表示图像中曲线的一段直线这就是最初的边界链编码(也即链码)表示法3.基本链码表达4-方向和8-方向链码图2 4-方向和8-方向链码4、改进的链码表示方式问题的引出:实际中直接对分割所得的目标边界编码可能出现两个问题:得到的链码往往太长;噪声等干扰会导致小的边界变化,而使链码发生与目标整体形状无关的较大变动解决方法:重采样!改进的链码表示实现方法首先,选择一个较大间隔的网格对边界进行重新采样接着,在目标边界轮廓上选择一个起始点;然后,从该起始点开始,按照顺时针方向,沿边界顺次地为边界上的各坐标点找出用4方向链码或8方向链码表示该线段时对应的方向编码值,并将其标注出来这样就可以用一串数字来表示图像中目标的边界了值得注意的是:(1)在这种链码表示法中,只有边界的起点需要用坐标表示,其余的点只可用线段的方向数来代表偏移量2)边界的链码值与起始点的选取有关,当起始点选取不同时,对应的链码也不同a)目标边界点与更大间隔网格 (b)与大网格节点对应的新边界点5、改进的链码表示方式-示例图3 改进链码的表示(c)4方向链码表示的重采样结果起始点1起始点20033333323222111111001 起始点1起始点236666553 3 22210 1图4 边界重采样及其4方向链码和8方向链码(d)8方向链码表示的重采样结果链码的归一化1. 链码表达存在的问题:1.对于同一个边界,选择不同的起点会得到不同的链码;2.对目标进行旋转,得到的链码表达不同。

      33图5 不同条件的链码表示1)起点归一化给定1个从任意点开始而产生的链码,可把它看作1个由各方向数构成的自然数将这些方向数依1个方向循环以使它们所构成的自然数的值最小我们将这样转换后所对应的链码起点作为这个边界的归一化链码的起点另一起点:33221010起点归一化链码表示2)链码的旋转归一化解决方法利用链码的一阶差分来重新构造1个序列(1个表示原链码各段之间方向变化的新序列)这相当于把链码进行旋转归一化原码 旋转90度码链码 (2)10103322 (3)212100334方向差分:差分码的定义0121...4,8NndCbb bNor−==001[()]nbaaNMODN−=−+设原链码为:一阶差分码为:1[()]iiibaaNMODN−=−+0121...4,8NnCaaa Nor−==链码优缺点优点:(a)数据压缩(b)可由链码直接计算图形的某些参数缺点:码串太长,噪声干扰链码表达课堂练习3 0 0 3 0 1 1 2 1 2 3 21 0 3 1 1 0 1 3 1 1 3 10 1 1 0 1 2 2 3 2 3 0 31 0 3 1 1 0 1 3 1 1 3 1图8 链码差分表示习题n (10分)求出链码11076765543322的归一化链码、一阶差分链码和归一化的一阶差分链码2形状数(1)定义:形状数是链码的最小值差分码。

      例如:基于4—方向的链码为:10103322,差分码为:33133030,形状数为:030331332)形状数的阶(order) 形状数序列的长度(即码的个数)对闭合曲线,阶总是偶数对凸形区域,阶对应边界外包围矩形的周长序号为4、6、8的形状数举例:序号4链码:0321差分:3333形状:3333序号6链码:003221差分:303303形状:033033序号8链码:00032221差分:30033003形状:00330033序号为6的形状数举例: 序号6链码:033211差分:330330形状:033033序号6链码:003221差分:303303形状:033033形状数与方向无关序号为8的形状数举例:序号8链码:03032211差分:33133030形状:03033133序号8链码:00332211差分:30303030形状:03030303序号8链码:00323211差分:30331330形状:03033133(3)存在问题虽然链码的首差是不依赖于旋转的,但一般情况下边界的编码依赖于网格的方向4)改进措施(规整化网格方向)大多数情况下,将链码网格与基本矩形对齐,即可得到一个唯一的形状数。

      规整化网格方向的一种算法如下:A、首先确定形状数的序号n;B、在序号为n的矩形形状数中,找出一个与给定形状的基本矩形的离心率最接近的形状数的矩形C、然后再用这个矩形与基本矩形对齐,构造网格D、用获得链码的方法得到链码;E、再得到循环差分;F、差分中的最小循环数即为形状数例如: 如果n=12,所有序号为12的矩形(即周长为12)为2*4,3*3,1*5如果2*4矩形的离心率最接近于给定边界的基本矩形的离心率,我们建立一个2*4的网格链码:000033222121差分:300030300313形状:0003030031330123边界线的离心率:长轴和短轴的比率A、边界最大轴a:是连接距离最远的两个点的线段B、边界最小轴b:与最大轴垂直,且其长度确定的包围盒刚好包围边界C、基本矩形: 包围边界的矩形边界最大轴a边界最小轴b基本矩形问题的引出实际应用中的数字边界常由于噪声、采样等的影响而有许多较小的不规则处,这些不规则处常对链码和边界段表达产生较明显的干扰影响轮廓线段的近似表达多边形方法的基本思想多边形是一系列线段的封闭集合,它可用来逼近大多数使用的曲线到任意的精度在实际中多边形表达的目的是要用尽量少的线段来代表边界并保持边界的基本形状,从而用较简单的形式来表达和描述边界。

      多边形表示的优点是它可以按照任意精度逼近目标的边界,特别当线段数等于边界的点数时,多边形就可以完全准确的表达边界1)基本概念A、一个任意集合S(区域)的凸起外缘H是:包含S 的最小凸起的集合B、H-S的差的集合被称为集合S的凸起补集DS SDS + D = H边界分段(2)分段算法:给进入和离开凸起补集D的变换点打标记来划分边界段3)优点:不依赖于方向和比例的变化S(4)存在问题噪音的影响,导致出现零碎的划分5)改进措施先平滑边界,或用多边形逼近边界,然后再分段多边形定义:多边形是由一系列线段构成的封闭集合多边形表示的优点是它可以按照任意精度逼近目标的边界,特别当线段数等于边界的点数时,多边形就可以完全准确的表达边界多边形的表达三种方法:① 基于收缩的最小周长多边形法;② 基于聚合的最小均方误差线段逼近法;③ 基于分裂的最小均方误差线段逼近法;1、最小周长多边形最小周长多边形法用彼此相连的单元格将目标的边界包住,此时边界被相连的单元格组成的内外两条环带所包围将边界看成可收缩的橡皮筋,单元格的内边缘看成是不可通过的墙壁,收缩橡皮筋可得到一个具有最小周长的多边形a) 目标边界和包围边界的单元格图9 边界的最小周长多边形最小周长多边形-举例:(b) 图(a)的最小周长多边形② 基于聚合的最小均方误差线段逼近法以一个边界点为起点,用直线依次连接该点与相邻点的边界点,分别计算各直线与边界的(逼近)拟合误差,将误差超过某个限度前的线段确定为多边形的一条边并将误差置零,然后以线段另一端点为起点继续连接边界点,直到绕边界一周。

      ② 基于聚合的最小均方误差线段逼近法abc defghij图10 基于聚合的最小均方误差线段逼近法图阈值③ 基于分裂的最小均方误差线段逼近法连接边界上相距最远的2个像素(即把边界分解成两部分),然后根据一定的准则进一步分解边界,构成多边形逼近边界,直到拟合误差满足一定的限度(例:边界线到某一直线的最大距离不能超过预定门限)③ 基于分裂的最小均方误差线段逼近法X1 XNY2X1 XNY2Y3X1 XNY2Y3Y4X1 XNY2Y3Y4图11 基于分裂的最小均方误差线段逼近法图阈值③ 基于分裂的最小均方误差线段逼近法图12 基于拆分技术的多边形表示法akjibc1cedh1hgf阈值③ 基于分裂的最小均方误差线段逼近法图13 基于分裂的最小均方误差线段逼近法过程图(a) (b)(c) (d)边界标记标记是一种利用一维函数表示二维边界的表示方法,它的目的是简化复杂的二维表示标记可由广义的投影产生水平的、垂直的、对角线的、或放射的、旋转的投影并不是一种能保持信息的变换,将2-D平面上的区域边界变换为1-D的曲线有可能丢失信息常用四种边界标记:1.距离为角度的函数2.切线角为弧长的函数3.距离为弧长函数4.斜率密度函数 距离为角度的函数先对给定的物体求出重心,然后把边界点与重心的距离作为角度的函数A Ar rq q2pi 2pi0 0r rA A(a) (b)( ) q( )q0049不受目标平移影响,但会随目标旋转或放缩而变化图14 边界标记1 y - s曲线(切线角为弧长的函数)沿边界围绕目标一周,在每个位置作出该点切线与一个参考方向(如横轴)的角度值A2piΑ2pi0 0A A(a) (b)y y02pis8spiss y y050水平直线段对应边界上的直线段(y不变)图15 边界标记2 斜率密度函数将y -s曲线沿y轴投影切线角的直方图h(q ) AA2pi 2pi0 0hA A(a) (b)qh q( ) q( )q02h q( ) h q( )051切线角有较快变化的边界段对应较深的谷图16 边界标记3 距离为弧长的函数将各个边界点与目标重心的距离作为边界点序列(围绕目标得到)的函数A2piΑ0 0A A(a) (b)0s8sAr s() rs()srs() 0 rs()s A52与距离为角度的函数相比?图17 边界标记4目标的层次表达n 目标是所有组成目标区域像素的集合n 常用表达方式:n 四叉树n 二叉树四叉树方法:利用金字塔式的数据结构表示数据。

      基本思路:(1)分层分解图象(2)利用金字塔式的数据结构四叉树表达法:(1)每次将图象一分为四(2)树结构 T = {N, A}四叉树目标结点混合结点背景结点特点:四叉树的树根对应整幅图像,树叶对应各单个像素或具有相同特定的像素组成的方阵图18 四叉树表示四叉。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.