
模式识别复习题.doc
19页模式识别复习题《模式识别》试题库一、基本概念题1.1 模式识别的三大核心问题是: 、 、 .12、模式分布为团状时,选用 聚类算法较好. 13 欧式距离具有 . 马式距离具有 (1)平移不变性 (2)旋转不变性 (3)尺度缩放不变性 (4)不受量纲影响的特性14 描述模式相似的测度有: 1)距离测度 (2)模糊测度 (3)相似测度 (4)匹配测度15 利用两类方法处理多类问题的技术途径有:(1) ;(2) ;(3) .其中最常用的是第 个技术途径6 判别函数的正负和数值大小在分类中的意义是: , 。
1.7 感知器算法 (1)只适用于线性可分的情况;(2)线性可分、不可分都适用. 18 积累位势函数法的判别界面一般为 (1)线性界面;(2)非线性界面.19 基于距离的类别可分性判据有: (1) (2) (3) 1.10 作为统计判别问题的模式分类,在( )情况下,可使用聂曼-皮尔逊判决准则1.11 确定性模式非线形分类的势函数法中,位势函数K(x,xk)与积累位势函数K(x)的关系为( )12 用作确定性模式非线形分类的势函数法,通常,两个n维向量x和xk的函数K(x,xk)若同时满足下列三个条件,都可作为势函数①( );②( );③ K(x,xk)是光滑函数,且是x和xk之间距离的单调下降函数。
113 散度Jij越大,说明wi类模式与wj类模式的分布( )当wi类模式与wj类模式的分布相同时,Jij=( )1.14 若用Parzen窗法估计模式的类概率密度函数,窗口尺寸h1过小可能产生的问题是( ),h1过大可能产生的问题是( )15 信息熵可以作为一种可分性判据的原因是: .1.16作为统计判别问题的模式分类,在( )条件下,最小损失判决规则与最小错误判决规则是等价的1.17 随机变量l()=p( |w1)/p( |w2),l( )又称似然比,则E{l( )|w2}=( )在最小误判概率准则下,对数似然比Bayes判决规则为( )。
118 影响类概率密度估计质量的最重要因素是( ).119 基于熵的可分性判据定义为,JH越( ),说明模式的可分性越强当P(wi| ) =( )(i=1,2,…,c)时,JH取极大值. 120 Kn近邻元法较之于Parzen窗法的优势在于( ).上述两种算法的共同弱点主要是( )1.21 已知有限状态自动机Af=(å,Q,d,q0,F),å={0,1};Q={q0,q1};d:d(q0,0)= q1,d(q0,1)= q1,d(q1,0)=q0,d(q1,1)=q0;q0=q0;F={q0}现有输入字符串:(a) 00011101011,(b) 1100110011,(c) 101100111000,(d)0010011,试问,用Af对上述字符串进行分类的结果为( ).1.22 句法模式识别中模式描述方法有: .(1)符号串 (2)树 (3)图 (4)特征向量1.23设集合X={a,b,c,d}上的关系, R={(a,a),(a,b),(a,d),(b,b),(b,a),(b,d),(c,c),(d,d),(d,a),(d,b)},则a,b,c,d生成的R等价类分别为 ( [a]R= ,[b]R= ,[c]R= ,[d]R= )。
1.24 如果集合X上的关系R是传递的、( )和( )的,则称R是一个等价关系.125一个模式识别系统由那几部分组成?画出其原理框图1.26 统计模式识别中,模式是如何描述的1.27 简述随机矢量之间的统计关系:不相关,正交,独立的定义及它们之间的关系.1.28 试证明,对于正态分布,不相关与独立是等价的.1.29 试证明,多元正态随机矢量的线性变换仍为多元正态随机矢量30 试证明,多元正态随机矢量的分量的线性组合是一正态随机变量. 第二部分 分析、证明、计算题第二章 聚类分析2.1 影响聚类结果的主要因素有那些?2.2 马氏距离有那些优点?23 如果各模式类呈现链状分布,衡量其类间距离用最小距离还是用最大距离?为什么?2.4 动态聚类算法较之于简单聚类算法的改进之处何在?层次聚类算法是动态聚类算法吗?比较层次聚类算法与c—均值算法的优劣.2.5 ISODATA算法较之于c-均值算法的优势何在?2.6 简述最小张树算法的优点2.7 证明马氏距离是平移不变的、非奇异线性变换不变的2.8 设,类、 的重心分别为 、 ,它们分别有样本 、 个将和 合并为 ,则 有 个样本。
另一类 的重心为 试证明 与 的距离平方是 2.9 (1)设有M类模式wi,i=1,2,.M,试证明总体散布矩阵ST是总类内散布矩阵SW与类间散布矩阵SB之和,即ST=SW+SB.(2)设有二维样本:x1=(—1,0)T,x2=(0,—1)T,x3=(0,0)T,x4=(2,0)T和x5=(0,2)T试选用一种合适的方法进行一维特征特征提取yi = WTxi .要求求出变换矩阵W,并求出变换结果yi ,(i=1,2,3,4,5).(3)根据(2)特征提取后的一维特征,选用一种合适的聚类算法将这些样本分为两类,要求每类样本个数不少于两个,并写出聚类过程2.10 (1)试给出c-均值算法的算法流程图;(2)试证明c-均值算法可使误差平方和准则最小其中,k是迭代次数;是 的样本均值11 现有2k+1个一维样本,其中k个样本在x=—2处重合,另k个样本在x=0处重合,只有1个在x=a>0处若a=2(k+1),证明,使误差平方和准则Jc最小的两类划分是x=0处的k个样本与x=a处的1个样本为一类,其余为另一类这里, c NjJc = å å(xi—mj)2 j=1 i=1其中,c为类别数,Nj是第j类的样本个数,xiÎwj,i=1,2,.。
Nj,mj是第j类的样本均值.2.12 有样本集,试用谱系聚类算法对其分类13 设有样本集S=,证明类心 到S中各样本点距离平方和 为最小时,有 . 2.14 假设s为模式矢量集X上的距离相似侧度,有且当时, .证明d是距离差异性测度15 证明欧氏距离满足旋转不变性.提示:运用Minkowski不等式,对于两矢量和 ,满足2.16证明: (a)如果s是类X上的距离相似侧度,,那么对于 , 也是类X上的距离测度. (b)如果d是类X上的距离差异性测度,那么对于, 也是类X上的距离差异性测度 2.17 假设是连续单调递增函数,满足 d是类X上的距离差异性测度且证明 也是类X上的距离差异性测度 2.18 假设s为类X上的距离相似侧度,有, 是连续单调递增函数,满足 证明是X上的距离相似侧度 2.19 证明:对于模式矢量集X上任意两个矢量和 有 2.20 (a)证明公式中 的最大最小值分别是和 b)证明当时,公式 中 221 假设d是模式矢量集X上的差异性测度,是相应相似测度 证明 其中和 是分别根据s和d所定义的. 的定义来自于下面公式,其中第一个集合只含有一个矢量。
提示:平均亲近函数 ,其中 和 分别是集合 和 的势即使 是测度,显然 不是测度.在公式中, 和 中的所有矢量都参与计算22 假设 2.23 考虑一维空间的两矢量,和 , ,定义距离 为 这个距离曾被提议作为欧氏距离的近似值. (a)证明是距离 (b)比较和 的计算复杂度 2.24 若定义下列准则函数其中是 中 个样本的均值向量, 是总散布矩阵,(1)证明对数据的非奇异线形变换具有不变性2)证明把中的样本 转移到 中去,则使 改变为(3)写出使最小化的迭代程序 2.25 证明对于C—均值算法,聚类准则函数满足使算法收敛的条件即若,则有 ) 2.26 令是点到聚类的相似性度量,式中 和 是聚类 的均值和协方差矩阵,若把一点从 转移到 中去,计算由公式所示 的变化值 第三章 判别域代数界面方程法3.1 证明感知器算法在训练模式是线性可分的情况下,经过有限次迭代后可以收敛到正确的解矢量 3.2(1)试给出LMSE算法(H-K算法)的算法流程图;(2)试证明X#e(k)=0,这里, X#是伪逆矩阵;e(k)为第k次迭代的误差向量;(3)已知两类模式样本w1:x1=(—1,0)T, x2=(1,0)T;w2:x3=(0,0)T,x4=(0,-1)T。
试用LMSE算法判断其线性可分性3 设等式方程组,其中:属于 的样本作为 的。
