您所在位置：网站首页 > 办公文档 > 模板/表格 > 财务表格图像理解-识别

图像理解-识别

8页

卖家[上传人]：cl****1

文档编号：481258020

上传时间：2023-05-30

文档格式：DOC

文档大小：53KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金贝

/ 8 举报版权申诉马上下载

文本预览

下载提示

常见问题

1、图像理解与模式识别1模式识别的根本概念以及模式识别在图像识别中的位置什么是模式呢?广义地说，存在于时间和空间中可观察的事物，如果我们可以区别它们是否相同或是否相似，都可以称之为模式。模式识别就是根据观察到的事物的模式对事物进行分类的过程。在图像识别技术中，模式识别占有核心的地位。所以的图像处理技术都是为了更好地进行模式识别做准备。模式识别是图像识别的实质性阶段。有两种根本的模式识别方法，即统计模式识别方法和结构(句法)模式识别方法，与此相应的模式识别系统都由两个过程所组成，即设计和实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器的设计。实现是指用所设计的分类器对待识别的样本进行分类决策。图 6-2 模式识别系统的根本构成模式识别系统如图6-2中，信息获取和预处理局部大致可以与图像的获取与处理对应。一般情况下，模式识别技术主要包含“特征提取和选择和“分类器的设计。近几十年来，模式识别技术开展很快。然而，开展较成熟、应用较广泛的主要是统计模式识别技术。本节将主要介绍统计模式识别技术主要内容，并对其它模式识别技术如结构模式识别、模糊模式识别方法、神经网络识别方法加以概述。2.

2、统计模式识别从一个广义的角度看，模式识别可以看成是一种机器学习的过程。按照机器学习过程的性质，可以将模式识别方法分成有监督的模式识别方法和非监督的模式识别方法，后者又称为聚类分析方法。这两种方法在图像识别中都有广泛的应用。1有监督的模式识别方法从识别技术的根本思路和方法看，有监督的模式识别可以分成两类：基于模型的方法和直接分类的方法。基于模型的方法的根底是贝叶斯(Bayes)决策理论方法，它对模式分析和分类器的设计有着实际的指导意义，是统计模式识别中的一个根本方法，用这个方法进行分类时要求：各类别总体的概率分布即所谓的先验概率和类条件概率是的；要决策分类的类别数是一定的。假设要研究的分类问题有c个类别，各类别状态用i来表示，i1，2，c；对应于各个类别i出现的先验概率P(i)以及类条件概率密度函数p(x|i)是的。如果在特征空间已观察到某一向量x，那么应该把x分到那一类中去才最合理呢?最根本的想法是根据观察到的信息，选择适当的分类策略，使分类可能出现的错误最少，即：如果对于任意ji，都有P(i|x) P(j|x)，那么将x归入类i 这就是“最小错误率的贝叶斯决策。一个例子是国际体

3、育联合会对运发动兴奋剂检查的策略。由于对服用兴奋剂的运发动发生漏检，最多只是丧失某一次比赛的结果的公平；而错怪没有服用兴奋剂的运发动有可能毁掉这个运发动的整个运动生涯。所以，当出现疑问时，国际体育联合会的原那么是：宁可使一千人漏网，也不能错怪一个好人。类似的思想表达在模式识别中，便是“基于最小风险的贝叶斯决策。设(i|j)是将j类中的样本归入i类所带来的损失，那么当观察到x时，将x归入i类的风险可以定义为：。最小风险的贝叶斯决策就是把x归入使最小的类中，即：如果对于任意ji，都有R(i| x) R(j| x)，那么将x归入类i。基于模型的识别技术中，关键就是要估计概率密度函数。其方法可分为参数估计和非参数估计两类。在许多实际问题中，由于样本特征空间的类条件概率密度的形式常常很难确定，利用Parzen窗等非参数方法估计分布又往往需要大量样本，而且随着特征空间维数的增加所需样本数急剧增加。由此，在实际问题中，我们往往不去恢复类条件概率密度，而是利用样本集直接设计分类器。具体说就是首先给定某个判别函数类，然后利用样本集确定出判别函数中的未知参数。这类方法就是有监督的模式识别方法中的另一类

4、重要的方法：直接分类方法。这类方法有3个要素：分类函数的类型线性还是非线性、分类目标函数、优化算法。下面分别介绍线性判别函数法和非线性判别函数法。线性判别函数法利用一类较为简单的判别函数。它首先假定判别函数g(x)是x的线性函数，即g(x)wTx十w0，对于c类问题，可以定义c个判别函数。这里关键的问题是如何利用样本集求得w和w0。不同的实际情况，往往提出不同的设计要求。这些设计要求，在数学上一般表现为特定的函数形式，我们称之为准那么函数。“尽可能好的结果相应于准那么函数取最优值。这实际上是将分类器设计问题转化为求准那么函数极值的问题了，这样就可以利用最优化技术解决模式识别问题。线性判别函数法的代表有：Fisher线性判别法、感知准那么函数法。Fisher线性判别法应用统计方法解决模式识别问题时，一再碰到的问题之一是维数问题。在低维空间里解析上或计算上行得通的方法，在高维空间里往往行不通。因此，降低维数有时就成为处理实际问题的关键。Fisher准那么函数的根本思想是，构造评价函数，使得当评价函数最优时，被分类的类别之间的距离尽可能大，同时各类内部样本间距离尽可能小。下式就是Fisher

5、准那么函数：式中分子代表类间距离；分子代表类内离散度。分类器的设计过程就是通过样本求得w和w0使JF(w)取得最大值。感知准那么函数法：设有一组样本y1，y2，yn，其中yn 是标准化增广样本向量，我们的目的是找一个解向量a*，使得显然，对于线性可分情况，问题才有解：为此这里首先考虑处理线性可分问题的算法。现在先构造这样一个准那么函数式中求和是对所有被权向量a错分的样本进行的。当y被错分时就有：aTy0，因此，上式中的，JP(a)总是大于等于0。当且仅当错分集为空集时JP(a)min JP(a)0，这时将不存在错分样本， “就是我们要寻找的解向量。这一准那么函数是20世纪50年代由Rosenblatt提出来，试图用于脑模型感知器上的，故一般称为感知准那么函数。近邻法最初的近邻法是由Cover和Hart于1968年提出的。由于对该方法在理论上进行了深入分析，直至现在仍是模式识别非参数法中最重要的方法之一。最简单的近邻决策规那么是最近邻决策规那么。所谓最近邻决策，是寻找与待分类样本最近的样本，认为待分类样本与后者同属一类。最近邻法的一个显然的推广是k近邻法。从字义上看，这个方法就是取未知样

6、本x的k个近邻，看这k个近邻中多数属于哪一类，就把x归为哪一类。近邻法的一个缺点是计算量大。解决的途径之一是采用快速算法，称之为快速搜索近邻法。其根本考虑是将样本分级分成一些不相交的子集，并在子集的根底上进行搜索。该算法对最近邻法和近邻法都适用。2非监督的模式识别方法在很多实际应用中由于缺少形成模式类过程的知识或者由于实际工作中的困难(例如卫星遥感照片上各像元的分类问题)，我们往往只能用没有类别标签的样本集进行工作。这就是通常所说的非监督学习方法。一般来说非监督学习方法可以分成两大类，即基于概率密度函数估计的直接方法和基于样本间相似性度量的间接聚类方法。不管是哪一种方法，在把样本集划分为假设干个子集(类别)后，我们或者直接用它解决分类问题或者把它作为训练样本集进行分类器设计。单峰子集(类)的别离方法：在没有任何类条件概率分布的先验知识情况下，我们只能把特征空间划分为假设干个区域Si，il，2，c，在每个区域中的混合密度应该是单峰的，如图6-3所示。我们把这些区域叫作单峰区域。假定每一个单峰区域Si和一个类别i相对应。有各种算法来实现这些单峰区域的划分。图 6-3 单峰子集别离示意图在应

7、用中，单峰子集(类)的别离方法，需要估计概率密度函数。为了防止估计概率密度函数的困难，我们可以在一定条件下，按照样本间的相似性把集合划分成假设干个子集，划分的结果应使某种表示聚类质量的准那么函数为最大。当用距离来表示两个样本间的相似度时，这样做的结果就把特征空间划分成假设干个区域，每一个区域相当于一个类别。一些常用的距离度量都可以作为这种相似件度量，在工程中，之所以常常用距离来表示样本间的相似度，是因为从经验上看，但凡同一类的样本，其特征向量应该是互相靠近的，而不同类的样本其特征向量之间的距离要大得多。这种方法虽然看起来似乎和上述的基于混合概率密度函数估计的聚类别离方法没有联系，但是由于概率密度的估计也是在样本间距离的根底上进行的，距离很近的两个特征向量经常是属于同一单峰子集。所以两种方法在概念上依然是互相关联的。常用的对数据集进行聚类的方法有两种，迭代的动态聚类算法和非迭代的分级聚类算法。动态聚类方法是一种普遍采用的方法，它具有以下3个要点：选定某种距离度量作为样本间的相似性度量；确定某个评价聚类结果质量的准那么函数；约定某个初始分类，然后用迭代算法找出使准那么函数取极值的最好聚类

8、结果。在非监督问题中，我们没有类别的样本集，甚至可能不知道类别数，可以利用的信息量大大减少了。所以，与监督模式识别相比，非监督模式识别问题中存在更大的不确定性。因此，在实际应用中，还要注意设法有效利用应用领域的专门知识，以弥补信息的缺乏。最终所得聚类的实际含义也往往只有依靠有关知识来解释和确定。3.结构模式识别：在一些图像识别的问题中，往往需要了解图像的结构信息。识别的目的不仅要能够把图像指定到一个特定类别(把它分类)，而且还要描述图像的形态。这时用语言结构法来识别图像就很有吸引力。句法方法使我们能够用一小组简单的模式基元和文法规那么来描述一大组复杂的图像模式。例如，考虑图6-4所示的场景。它是有一些物体和背景组成。物体中又包含一个三角体和一个长方体，三角体和长方体又由一些面组成这样，我们可以逐级地描写这种结构见图6-5。图6-4 一个场景的示意图图 6-5 场景结构的分析显然，这种逐级描写的结构方法与语言学中的句子分析有类似之处。取最简单的基元，用一定的规那么构成较为复杂的子图像，再根据一定的规律，从子图像逐步构成一幅场景。这就是句法模式识别的由来，其中基元之间的连接规那么称为

9、文法。用基元及其文法进行描述图像结构的语言称为图像描述语言。应当注意，在选取基元时，如果选择得非常简单，其优点是容易识别基元，但是不易用紧凑的文法来描写图像；反之，如果基元选得比拟复杂，虽然易于用紧凑的文法来描写图像，但基元本身却不容易识别。这二者往往是矛盾的，实际应用中需要兼顾折中。有了基元后，必须对各种训练样本构造文法，以形成语言，并用以描述图像。一般根据先验知识进行人工编制。当编制出来几条文法规那么后，再用结构信息的图像来进行句子分析，如果能够分析出正确的结构，那么文法可以采用；否那么修改文法，直到能正确分析。对一种文法来说，如果规那么很多，功能就强，然而运行代价也大；反之，如果功能弱，那么很多图像无法描述。4.模糊模式识别方法1965年，Zadeh提出了他著名的模糊集理论，从此创立了一个新的学科模糊数学。模糊集理论是对传统集合理论的一种推广，在传统集合理论中，一个元素或者同于一个集合，或者不属于一个集合；而对于模糊集来说，每一个元素都是以一定的程度属于某个集合，也可以同时以不同的程度属于几个集合。对人们现实生活中大量使用的一些含义确定，但又不准确的语言表述。比方“今天天气很热、“车速过高，需要适当踩刹车等，模糊数学能够较好地表达。因此，模糊数学被很多人认为是解决很多人工智能问题，尤其是常识性问题的最适宜的数学工具。关于模糊数学有几种不同的名称：一种叫法是模糊集，它是相对于经典的集合理论而言的；一种是模糊逻辑，相对于传统的“是或者不是的二值逻辑而言；模糊数学那么是一种更广泛的叫法，更倾向于指从数学角度对模糊集和模糊逻辑的研究；从应用的角度，很多人更习惯于用模糊系统的叫法，用来指采用了模糊数学的思想和理论的方法或系统，而其中采用的一些技术往往称作模糊技术和模糊方法。这些名词本身也具有很大的模糊性，但其实质都是同样的。将模糊技术应用于各个不同的领域，就产生

《图像理解-识别》由会员cl****1分享，可在线阅读，更多相关《图像理解-识别》请在金锄头文库上搜索。

点击阅读更多内容

TA的资源

感动中国观后感

优秀班主任工作心得体会

HSE风险分析解析

IC标准版消费系统作及数据库安装教程说明

我渴望的自由作文

安徽省怀远县高三理综押题卷二

（精品模板）2022年师德培训心得体会模板6篇

美术教师实习心得体会

“三·八”妇女节活动方案范文（六篇）

设计师个人工作计划安排标准范本（2篇）.doc

2023年不忘英烈,清明追思征文-不忘先烈清明追思征文

预算部经理招聘参考

商业银行三季度工作总结

黑龙江智能焊装装备项目实施方案参考模板

人教版初中语文文言文翻译

国学经典考试题

医院开展“五一”期间安全生产自查自纠情况的报告

免烧砖项目可行性研究报告-完整可修改版

承德关于成立功能性器件技术应用公司可行性报告（范文参考）

最新高中同步测试卷鲁科化学选修3：高中同步测试卷十三 Word版含解析

点击查看更多

新上传的WORD文档

护士的个人述职报告范文七篇小学六年级英语教学计划八年级下册政治试题信息系统运维项目及方案《中国少年先锋队队歌》教学设计学校物业服务合同范本概率论与数理统计期末试卷及(新颖7)(DOC 12页) 2023年公司安全管理报告4篇 2022年大学专科实习工作总结仓储场地租赁合同律师版（4篇）.doc 2023租房协议书简单一点范文（八篇）微型计算机原理与接口技术实验指导会计顶岗实习过程记录表初任民警心得体会(心得体会) 《庐山的云雾》教案