
模式识别试题及总结.docx
59页一、填空与选择填空(本题答案写在此试卷上,30分)1、 模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类 2、 统计模式识别中描述模式的方法一般使用 特真矢量;句法模式识别中模式 描述方法一般有串、树、网 3、 聚类分析算法属于(1);判别域代数界面方程法属于 (3) 1)无监督分类 (2)有监督分类 (3)统计模式识别方法(4)句法模式识别方法4、 若描述模式的特征量为0-1二值特征量,则一般采用 (4) 进行相似性度量1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度5、 下列函数可以作为聚类分析中的准则函数的有 (1)(3)(4) 1 ) ( 2 )(4)6、 Fisher线性判别函数的求解过程是将N维特征矢量投影在 (2) 中进行1)二维空间 (2)一维空间 (3)N-1维空间7、 下列判别域界面方程法中只适用于线性可分情况的算法七O;线性可分、不可分都适用的有 (3)1)感知器算法 (2)H-K算法 (3)积累位势函数法8、 下列四元组中满足文法定义的有 (1)(2)(4) 1) ({A, B), {0, 1}, {A 01, A 0A1, A 1A0, B BA, B 0},A)(2) ({A}, {0, 1}, {A 0,A 0A},A)(3)({S}, {a,b},{S 00S,S 11S,S 00,S 11},S)(4)({A}, {0, 1}, {A 01,A 0A1,A 1A0},A)9、 影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、 欧式距离具有(1、2 );马式距离具有(1、2、3、4 )1)平移不变性(2)旋转不变性(3)尺度缩放不变性(4)不受量纲影响的 特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于 判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距 离12、感知器算法1)只适用于线性可分的情况;(2)线性可分、不可分都适用13、 积累势函数法较之于H-K算法的优点是(该方法可用于非线性可分情况(也 可用于线性可分情况));位势函数K(x,xk)与积累位势函数K(x)的关系为K (X) = Z a K(x, x )/ -〜k k 、( X/X )14、 在统计模式分类问题中,聂曼-皮尔逊判决准则主要用于(羞一种判决错 误较另一种判决错误更为重要)情况;最小最大判决准则主要用于(先验概率未 知的)情况15、 “特征个数越多越有利于分类”这种说法正确吗?(错误)特征选择的 主要目的是(从n个特征中选出最有利于分类的的m个特征(m
17、已知有限状态自动机 Af=( ,Q, ,q0,F),={0,1}; Q={q0,qi};:(q0,0)= qi, (qo,i)= qi, (qi,0)=q0, (qi,i)=q0; q0二q0; F={qo}现有输 入字符串:(a) 000iii0i0ii, (b) ii00ii00ii, (c) i0ii00iii000,(d)00i00ii,试问,用 Af 对上述字符串进行分类的结果为(3i:{a,d};g:{b,c})i8、影响聚类算法结果的主要因素有(—②③④_)①已知类别的样本质量;②分类准则;③特征选取;④模式相似性测度i9、模式识别中,马式距离较之于欧式距离的优点是(—③④—)①平移不变性;②旋转不变性;③尺度不变性;④考虑了模式的分布20、 基于二次准则函数的H-K算法较之于感知器算法的优点是(—①③_)①可以判别问题是否线性可分;②其解完全适用于非线性可分的情况;③其解的适应性更好;④计算量小21、 影响基本C均值算法的主要因素有(—④①②—)①样本输入顺序;②模式相似性测度;③聚类准则;④初始类心的选取22、位势函数法的积累势函数K(x)的作用相当于Bayes判决中的(—②④_)。
①先验概率;②后验概率;③类概率密度;④类概率密度与先验概率的乘积23、 在统计模式分类问题中,当先验概率未知时,可以使用(—②④_)①最小损失准则;②最小最大损失准则;③最小误判概率准则;④N-P判决24、 在(—①③)情况下,用分支定界法做特征选择计算量相对较少①Cnd>>n,(n为原特征个数,d为要选出的特征个数);②样本较多;③选用的 可分性判据J对特征数目单调不减;④选用的可分性判据J具有可加性25、 散度JD是根据(—③—)构造的可分性判据①先验概率;②后验概率;③类概率密度;④信息熵;⑤几何距离26、 似然函数的概型已知且为单峰,则可用(—①②③④⑤_)估计该似然函数①矩估计;②最大似然估计;③Bayes估计;④Bayes学习;⑤Parzen窗法27、 Kn近邻元法较之Parzen窗法的优点是(_②_)①所需样本数较少;②稳定性较好;③分辨率较高;④连续性较好28、 从分类的角度讲,用DKLT做特征提取主要利用了 DKLT的性质:(—① ③_)①变换产生的新分量正交或不相关;②以部分新的分量表示原矢量均方误差最 小;③使变换后的矢量能量更趋集中;29、 一般,剪辑k-NN最近邻方法在(—①_)的情况下效果较好。
①样本数较大;②样本数较小;③样本呈团状分布;④样本呈链状分布30、 如果以特征向量的相关系数作为模式相似性测度,则影响聚类算法结果的 主要因素有(—②③_)①已知类别样本质量;②分类准则;③特征选取;④量纲二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的答:(1)分类准则,模式相似性测度,特征量的选择,量纲2)证明:(2分)设,有非奇异线性变换:(1分)(2分)(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之答:(1)(4 分)正比于的距离的绝对值到超平平面 的方程可以写成式中 于是页脚内容11是平面的单位法矢量,上式可写成中的任一点,中任一点,点到平面 的距离为差矢量 在 上的投影的绝对值,即(1-1)在平面上式中利用了中,故满足方程式(11)的分子为判别函数绝对值,上式表明正比于到超平面的距离个特征矢量代入判别函数后所得值的绝对值越大表明该特征点距判别界面越远2)(4分) 的正(负)反映在超平面 的正(负)侧两 矢 量的数积为(2分)显然,当夹角小于时,即指向的那个半空间中,>0;反之,当夹角大于时,即背向的那个半空间中,<0。
由于,故同号所以,当指向的半空间中时,;当背向的半空间中,判别函数值的正负表示出特征点位于哪个半空间 中,或者换句话说,表示特征点位于界面的哪一侧五、(12分,每问4分)在目标识别中,假定有农田和装甲车两种类型,类型7 和类型2分别代表农田和装甲车,它们的先验概率分别为0.8和0.2,损失函数如表1 所示现在做了三次试验,获得三个样本的类概率密度如下::0.3,0.1,0.6:0.7,0.8, 0.3(1) 试用贝叶斯最小误判概率准则判决三个样本各属于哪一个类型;(2) 假定只考虑前两种判决,试用贝叶斯最小风险准则判决三个样本各属于哪一 类;(3)把拒绝判决考虑在内,重新考核三次试验的结果表1类型\^ 损失判决o 1a 114解:由题可知:,(1)(4分)根据贝叶斯最小误判概率准则知:,则可以任判;,则判为,则判为(2)(4分)由题可知:,判为,判为,判为(3)(4分)对于两类问题,对于样本 ,假设已知,有则对于第一个样本,。












