word一、 填空与选择填空〔此题答案写在此试卷上, 30 分〕1、模式识别系统的根本构成单元包括: 模式采集 、 特点提取与选择和 模式分类 ;2、统计模式识别中描述模式的方法一般使用 特真矢量 ;句法模式识别中模式描述方法一般有 串 、树 、 网 ;3、聚类分析算法属于 〔1〕 ;判别域代数界面方程法属于 〔3〕 ;〔 1〕无监视分类 〔2〕 有监视分类 〔3〕统计模式识别方法〔 4〕句法模式识别方法 4、假如描述模式的特点量为 0-1 二值特点量,如此一般采纳 〔4〕 进展相像性度量;〔1〕距离测度 〔2〕模糊测度 〔3〕相像测度 〔 4〕匹配测度5、 如下函数可以作为聚类分析中的准如此函数的有 〔1〕〔 3〕〔 4〕 ;〔1〕 〔2〕 〔3〕〔4〕6、Fisher 线性判别函数的求解过程是将 N 维特点矢量投影在 〔2〕 中进展 ;〔1〕二维空间 〔2〕一维空间 〔3〕N-1 维空间7、如下判别域界面方程法中只适用于线性可分情形的算法有 〔1〕 ;线性可分、不行分都适用的有〔3〕 ;〔 1〕感知器算法 〔 2〕H-K 算法 〔3〕积存位势函数法8 、如下四元组中满意文法定义的有 〔1〕〔 2〕〔 4〕 ;〔1〕〔{ A, B}, {0, 1}, { A 01, A 0 A1 , A 1 A0 , B BA , B 0}, A〕〔2〕〔{ A}, {0, 1}, { A 0, A 0 A}, A〕〔3〕〔{ S}, { a, b}, { S 00 S, S 11 S, S 00, S 11}, S〕〔4〕〔{ A}, {0, 1}, { A 01, A 0 A1, A 1 A0}, A〕9、影响层次聚类算法结果的主要因素有〔 运算模式距离的测度、 〔聚类准如此、类间距离门限、预定的类别数目〕 〕;10、欧式距离具有〔 1 、2 〕;马式距离具有〔 1、2、3、4 〕;〔 1〕平移不变性〔 2〕旋转不变性〔 3〕尺度缩放不变性〔 4〕不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是〔 正〔负〕表示样本点位于判别界面法向量指向的正〔负〕半空间中;肯定值正比于样本点到判别界面的距离; 〕;12、感知器算法 1;〔 1〕只适用于线性可分的情形;〔 2〕线性可分、不行分都适用;23 / 2113、积存势函数法较之于 H-K 算法的优点是 〔该方法可用于非线性可分情形 〔也可用于线性可分情形〕 〕;位势函数 K〔x,x k 〕 与积存位势函数 K〔x〕 的关系为〔K 〔 x〕~xk Xk K 〔 x, xk 〕〕;14、在统计模式分类问题中,聂曼 - 皮尔逊判决准如此主要用于〔 某一种判决错误较另一种判决错误更为重要 〕情形;最小最大判决准如此主要用于〔 先验概率未知的 〕情形;15、“特点个数越多越有利于分类〞这种说法正确吗? 〔错误 〕;特点选择的主要目的是 〔从 n 个特点中选出最有利于分类的的 m个特点〔 m>n 〕的条件下,可以使用分支定界法以削减运算量;16、 散度 Jij 越大,说明 i 类模式与 j 类模式的分布〔 差异越大 〕;当 i 类模式与 j 类模式的分布一样时, Jij= 〔 0〕;17、 有限状态自动机 Af=〔 , Q, , q0, F〕, ={0 , 1} ;Q={q0, q1} ; : 〔q0 , 0〕= q1 , 〔q0 , 1〕= q1, 〔q1 , 0〕=q0 , ω 1:{a,d}; ω 2:{b,c} 〕;18、影响聚类算法结果的主要因素有〔 ②③④ 〕;①类别的样本质量;②分类准如此;③特点选取;④模式相像性测度;19、模式识别中,马式距离较之于欧式距离的优点是〔 ③④ 〕;①平移不变性;②旋转不变性;③尺度不变性;④考虑了模式的分布;20、基于二次准如此函数的 H-K 算法较之于感知器算法的优点是〔 ①③ 〕;①可以判别问题是否线性可分;②其解完全适用于非线性可分的情形;③其解的适应性更好;④运算量小;21、影响根本 C均值算法的主要因素有〔 ④①② 〕;①样本输入次序;②模式相像性测度;③聚类准如此;④初始类心的选取;22、位势函数法的积存势函数 K〔x〕 的作用相当于 Bayes 判决中的〔 ②④ 〕;①先验概率;②后验概率;③类概率密度;④类概率密度与先验概率的乘积;23、在统计模式分类问题中,当先验概率未知时,可以使用〔 ②④ 〕;①最小缺失准如此;②最小最大缺失准如此;③最小误判概率准如此;④ N-P 判决;24、在〔 ①③ 〕情形下,用分支定界法做特点选择运算量相对较少;d① >>n, 〔n 为原特点个数, d 为要选出的特点个数〕 ;②样本较多;③选用的可分性判据 J 对特点数目单调不减;④选用的可分性判据 J 具有可加性;25、 散度 JD 是依据〔 ③ 〕构造的可分性判据;①先验概率;②后验概率;③类概率密度;④信息熵;⑤几何距离;26、似然函数的概型且为单峰,如此可用〔 ①②③④⑤ 〕估量该似然函数;①矩估量;②最大似然估量;③ Bayes 估量;④ Bayes 学习;⑤ Parzen 窗法;27、 Kn近邻元法较之 Parzen 窗法的优点是〔 ② 〕;①所需样本数较少;②稳固性较好;③辨论率较高;④连续性较好;28、从分类的角度讲,用 DKLT做特点提取主要利用了 DKLT的性质:〔①③ 〕;①变换产生的新重量正交或不相关; ②以局部新的重量表示原矢量均方误差最小; ③使变换后的矢量能量更趋集中;29、一般,剪辑 k-NN 最近邻方法在〔 ① 〕的情形下成效较好;①样本数较大;②样本数较小;③样本呈团状分布;④样本呈链状分布;30、假如以特点向量的相关系数作为模式相像性测度,如此影响聚类算法结果的主要因素有〔②③〕 ;①类别样本质量;②分类准如此;③特点选取;④量纲;二、 〔15 分〕 简答与证明题〔1〕影响聚类结果的主要因素有那些?〔2〕证明马氏距离是平移不变的、非奇特线性变换不变的;答:〔 1〕分类准如此,模式相像性测度,特点量的选择,量纲;〔2〕证明:〔2 分〕〔2 分〕〔1 分〕设,有非奇特线性变换: 〔1 分〕〔4 分〕三、 〔8 分〕 说明线性判别函数的正负和数值大小在分类中的意义并证明之;答: 〔 1〕〔4 分〕 的肯定值 正比于 到超平面 的距离平面 的方程可以写成式中 ;于是 是平面 的单位法矢量,上式可写成设 是平面 中的任一点, 是特点空间 中任一点, 点 到平面 的距离为差矢量 在上的投影的肯定值,即〔1-1〕上式中利用了 在平面 中,故满意方程式〔1-1〕 的分子为判别函数肯定值, 上式明确, 的值 正比于 到超平面 的距离 , 一个特点矢量代入判别函数后所得值的肯定值越大明确该特点点距判别界面越远;〔2〕〔4 分〕 的正〔负〕反映 在超平面 的正〔负〕侧两矢量 和 的数积为〔2 分〕明显,当 和 夹角小于 时,即 在 指向的那个半空间中, >0;反之,当和 夹角大于 时,即 在 背向的那个半空间中, <0;由于 ,故和 同号;所以,当 在 指向的半空间中时, ;当 在 背向的半空间中, ;判别函数值的正负表示出特点点位于哪个半空间中,或者换句话说,表示特征点位于界面的哪一侧;五、〔12 分,每问 4 分〕 在目标识别中,假定有农田和装甲车两种类型,类型 1 和类型 2 分别代表农田和装甲车,它们的先验概率分别为 0.8 和 0.2 ,缺失函数如表 1 所示;现在做了三次试验,获得三个样本的类概率密度如下:: 0.3 , 0.1 , 0.6: 0.7 , 0.8 ,0.3〔1〕 试用贝叶斯最小误判概率准如此判决三个样本各属于哪一个类型;〔2〕 假定只考虑前两种判决,试用贝叶斯最小风险准如此判决三个样本各属于哪一类;〔3〕 把拒绝判决考虑在内,重新考核三次试验的结果;表 1类型缺失 1判决1451111解:由题可知: , , ,,〔1〕〔 4 分〕 依据贝叶斯最小误判概率准如此知:,如此可以任判; ,如此判为 ; ,如此判为 ;〔2〕〔4 分〕 由题可知:如此 ,判为 ;,判为 ;,判为 ;〔 3〕〔4 分〕 对于两类问题,对于样本 ,假设 ,有如此对于第一个样本,,如此拒判;,如此拒判;1. 监视学习与非监视学习的区分:,拒判;监视学习方法用来对数据实现分类,分类规如此通过训练获得;该训练集由带分类号的数据集组成,因此监视学习方法的训练过程是离线的;非监视学习方法不需要单独的离线训练过程,也没有带分类号〔标号〕的训练数据集,一般用来对数据集进展分析,如聚类,确定其分布的主重量等;〔实例: 道路图〕 就道路图像的分割而言, 监视学习方法如此先在训练用图像中猎取道路象素与非道路象素集, 进展分类器设计,然后用所设计的分类器对道路图像进展分割;使用非监视学习方法, 如此依据道路路面象素与非道路象素之间的聚类分析进展聚类运算, 以实现道路图像的分割;2. 动态聚类是指对当前聚类通过迭代运算改善聚类;分级聚类如此是将样本个体,按相像度标准合并,随着相像度要求的降低实现合并;3. 线性分类器三种最优准如此:Fisher 准如此 :依据两类样本一般类内密集 , 类间别离的特点,查找线性分类器最优的法线向量方向,使两类样本在该方向上的投影满意类内尽可能密集,类间尽可能分开;该种度量通过类内离散矩阵 Sw 和类间离散矩阵 Sb 实现;感知准如此函数 :准如此函数以使错分类样本到分界面距离之和最小为原如此;其优点是通过错分类样本供应的信息对分类器函数进展修正,这种准如此是人工神经元网络多层感知器的根底;支持向量机 :根本思想是在两类线性可分条件下,所设计的分类器界面使两类之间的间隔为最大 , 它的根本出发点是使期望泛化风险尽可能小;一、 试问 “模式〞与 “模式类〞的含义;假如一位姓王的先生是位老年人,试问 “王先生〞和 “老头〞谁是模式,谁是模式类?答:在模式识别学科中, 就“模式〞与 “模式类〞而言, 模式类是一类事物的代表, 概念或典型, 而“模式〞如此是某一事物的详细表现,如 “老头〞是模式类,而王先生如此是 “模式〞,是 “老头〞的详细化;二、 试说明 Mahalanobis 距离平方的定义,到某点的 Mahalanobis 距离平方为。