
计算机视觉基础复习.docx
12页第一章 PPTP11 什么是计算机视觉 采用计算机实现人类视觉功能,让计算机理解图像和视频 P12 计算机视觉与图像处理的区别►数字图像处理图像/视频-> 图像/视频(图像变换、图像滤波、图像复原、图像压缩、…)► 计算机视觉图像/视频 -> 模型 (二维基素图 -> 2.5 维要素图 -> 三维模型表征)P14-20 计算机视觉中存在哪些难点和挑战 挑战:外观、大小和形状;复杂姿态/运动;复杂和不可预测的行为;噪声和遮挡;外 观变化;上下文间依赖性;视点变化P23-28 图像中存在哪些计算机视觉线索 深度线索:直线透视;空间透视 远近顺序线索:遮挡 形状线索:纹理梯度 形状和光照线索:阴影 位置和光照线索:投影P30-46 计算机视觉有哪些典型应用OCR (光学字符识别)、智能交通、人脸检测、表情识别、多视点三维重建、基于视觉 的生物识别、辅助驾驶、无人驾驶汽车、基于视觉的人机交互、智能机器人、工业机器 人P48 CCD/CMOS 传感器的成像原理:光电转换P49-54 采样与量化影响图像的哪些属性 采样影响图像空间分辨率;量化影响图像幅度分辨率(灰度)P61 图像坐标系 左上角为坐标原点P75-78像素距离与邻域关系习题1.2 P19计算机视觉要达到的目的有哪些?答:计算机通过图像和视频对客观世界的感知识别和理解;对场景进行解释和描述: 根据对场景的解释和描述制定行为规划。
第三章PPTP11 薄透镜成像模型P17-21 射影几何中哪些物理信息丢失和保留了?丢失信息:长度、角度 保留信息:直线特性、交比不变性P22-24 灭点和灭线的概念 场景中的平行线投影到图像平面后,会聚于“灭点” 灭线:灭点的集合P46-49 像机成像过程中包含了哪些内参和外参?像机内参和外参:一般化形式-coi3/dx1/(妙• sin 0) v0f 00 f0uV1—只3述Exl[ofxl 1 _」10 I 00 ; 0 l:0*^3x3 ExlYhL i _Z11£ = f险 fy = fdy) y = —f cctd/dx像机内参和外参:一般化形式像机内部参数像机外部参数(内参) (外参)A r % 丨 oR T 1o厶坯;o±x3x3 ^3x110 0 1 ] 0_ 3x1 」[ 1卩表示肚轴和¥轴的不垂直因子像机内参和外参说明卜像机内参或:以轴尺度因子,或称盘轴归一化焦距兀:非轴尺度因子,或称#轴归一化焦距 7 :鮎轴和敦轴的不垂直因子,通常为0 °阪旳:光学中心►像机外参R:像机旋转矩阵T :像机平移矩阵P51 像机标定的目的,思路和基本方法►目的:确定像机的内参和外参。
zuvr fx0Y fu0v;0rR3x3T _3x1rXYpy0110T1Z1001i 01- 3x1—1_11►思路:通过一组已知世界坐标的图像特征点,建立超定方程求解► 方法:最小二乘求解超定方程,寻找最优估计P63 径向畸变和切向畸变的概念JC径向畸变和切向畸变►将图像坐标转为极坐标 表 7JV o>曲为极坐标的幅度变化 量,表现为径向畸变» dr为极坐标的角度变化 量,表现为切向畸变>在大多数视觉应用中切 向畸变通常很小,因此 可忽略习题 第四章 PPTP4-7 图像平移、尺度、旋转和级联变换►用矩阵乘实现级联变换►如图像依次进行平移、尺度和旋转变换,有uuuv'=R - S - T -v=Av111P14 最近邻插值P16-18 双线性插值P20-31 图像灰度映射 灰度映射原理► 基于图像像素的点操作►映射函数► 灰度映射的关键是根据增强要求设计映射函数 灰度映射:图像二值化、图像反色、动态范围压缩、对比度增强P31-32 直方图的概念和意义,用已学过的数学原理进行解释P40 直方图均衡计算表 4.3.1 L 为灰度级数(本例为 8)原始图灰度级01234567原始直方图0.020.050.090.120.140.20.220.16累积直方图 gf0.020.070.160.280.420.620.841.0四舍五入取整00123467 注:int((L-1)*gf+0・5)确定映射关系0,1->02->13->24->35->46->67->7新直方图0.070.090.120.140.200.220.16直方图均衡过程示例►理解:1.滤波取自信号处理中的概念;2.滤波是在图像空间通过邻域操作完成的;3. 邻域操作通常借助模板运算来实现P69 中值滤波概念和基本步骤► 概念:选择局部窗口中亮度的中间值代替窗口中心像素► 步骤:◦ 将模板中心与图像中某像素位置重合◦ 读取模板下各对应像素的灰度值◦ 将这些灰度值从小到大排成一列◦ 找出这些灰度值里排在中间的一个◦ 将这个中间值赋给对应模板中心位置像素◦ 遍历图像中所有像素P71 中值滤波与均值滤波的比较> 中值滤波和线性滤波的区别:1、 中值滤波可有效消除突变,线性滤波总是响应所有的变化2、 中值滤波具有部分不连续保持特性,线性滤波会产生平滑过渡的效果> 中值滤波和均值滤波的区别:中值滤波器比均值滤波器更适合去除加性椒盐噪声习题 4.3 P75► 设用三角形代替下图中的四边形,建立与下式相对应的校正几何形变的空间变换式。
xf = kxx + k2y + k^xy + k4 yr = k5x + k6y + k7xy + ks►解:以顶点为对应点,一个对应点可列出2个公式,因此三角形的三个顶点可列出6个公式,最多求解6个几何形变参数,因此空间变换式为:习题 4.11 P76X = k x + k y + k123y' = k x + k y + k456►将M幅图像相加求平均可以获得消除噪声的效果,用一个nxn的模板进行平滑滤波 也可获得消除噪声的效果,试比较两种方法的消噪效果► M幅图像相加求平均时间轴上的平均容易产生运动模糊(重影)► nxn模板的平滑滤波=> 空间上的平均 容易产生空间模糊(边缘模糊)习题 4.12 P76► 讨论用于空间滤波的平滑滤波和锐化滤波的相同点、不同点以及联系► 相同点:都能减弱或消除频域空间中的某些分量,而不影响或较少影响其它分量, 从而达到增强效果► 不同点:平滑滤波减弱或消除高频分量,增强低频分量,平滑图像中的细节信息 锐化滤波减弱或消除低频分量,增强高频分量,锐化图像中细节信息► 联系:两者效果相反,互为补充;从原始图像中减去平滑滤波结果可得到锐化滤波 效果;而原始图像中减去锐化滤波结果可得到平滑滤波效果。
第五章 PPTP4 为什么要边缘检测和边缘的成因为什么要边缘检测:► 提取信息,识别目标► 恢复几何和视点边缘的成因:曲面法线不连续、深度不连续、表面颜色不连续、亮度不连续P10-21用已学过的数学原理解释边缘检测的原理► 二阶导数过零点来检测 图像中边缘的存在边缘图惊A一阶爭綾二阶孚最边缘与导数(微分)的关系► 一阶导数极值点对应的 是边缘位置,极值的正 或负表示边缘处是由暗 变亮还是由亮变暗P15 有哪些一阶导数算子?试写出其模板形式Roberts 梯度算子均差分)-11111-11-11-1-1-1Sobel算子(加权平均差分)各向同性 Sobel 算子:将模板中的权值2改为V 2,以使水平、垂直和对角边缘的梯度值相同P21 有哪些二阶导数算子?二阶导数算子会对噪声敏感,试解释原因 拉普拉斯算子、马尔算子 对噪声敏感原因:二阶导数在边缘处出现零交叉,即边缘点两边导数取异号,据此来 检测边缘点但很容易被噪声覆盖P28 Canny算子的最优检测准则►最优边缘检测的含义是:◦ 好的检测 -- 算法能标识图像中的实际边缘,避免噪声和虚假边缘干扰◦ 好的定位 -- 标识出的边缘与实际图像中的实际边缘尽可能接近。
◦ 最小响应 -- 对图像中的每个真实边缘点只有一个像素响应P41 什么是角点?角点有什么特性?► 可重复性/可再现性 同一角点应能在不同图像中检测出,不受几何和亮度等变化的影响► 显著性每个角点都是独特的► 局部性 特征描述的是图像中的一个局部小区域P43 SUSAN 角点检测的基本原理◦ 采用圆形模板◦ 统计模板中与模板核具有相同值的像素个数◦ USAN 面积随模板在图像中的位置变化◦ 利用 USAN 面积变化可检测边缘或角点◦ USAN面积在图像角点处具有最小值,故称为SUSANP51 Hough变换的基本思想(投票)以及为什么要进行Hough变换 基本思想:► 通常用在边缘检测或特征点检测后► 每个边缘点根据其可能的几何特征,投影到参数空间,通过投票方式确定参数值 即票数最多的参数获胜为什么要进行 Hough 变换:►视觉场景中许多目标都可通过直线、圆弧等规则几何特征来表述Hough变换是获 取规则几何特征的常用方法P55 Hough变换中参数空间的概念,试写出直线检测以及圆检测的参数空间 米用(p,涉)表示图像空间中任意直线 图像空间中一条直线在参数空间(p,切中为一个点参数空间(0切也称为Hough空间P68 Hough变换的优点► 对边缘不连续具有较好的容忍性► 对噪声干扰具有较好的鲁棒性► 对目标遮挡具有较好的抗干扰性习题第六章 PPTP2 目标分割的概念、目的、意义► 概念:将图像划分成若干具有特征一致性且互不重叠的图像区域的过程。
► 目的:有选择性地定位感兴趣对象在图像中的位置和范围► 意义:1. 区域对于图像理解和识别非常重要,往往表征场景中的目标,或部分目标2. 一幅图像可以包含多个目标,每个目标包含多个区域,每个区域对应目标的不同 部分3. 图像分割是将图像划分为一组有意义的区域P14 图像分割有哪些方法?基于哪些特征► 基于边缘的分割方法:◦ 先提取区域边界,再确定边界限定的区域;► 基于区域的分割方法:◦ 确定每个像素的归属区域,从而完成分割► 图像分割方法分类:a) 自动分割算法-聚类方法-基于边缘的方法-区域融合和区域增长-混合优化方法b) 交互式图像分割算法- "Snake”或"主动轮廓法”-“魔棒”或“魔笔”► 图像分割通常基于亮度、颜色、纹理、深。
