
多元统计分析模拟试题.docx
9页本文格式为Word版,下载可任意编辑多元统计分析模拟试题 多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步判别法 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的抉择系数算出,他们之间的关系为P P=√P?P P 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化为几个综 合指标的多元统计方法 10)在举行主成分分析时,我们认为所取的m(mp,p为全体的主成分)个主成分的累积贡 献率达成85%以上对比适合 11)聚类分析的目的在于使类内对象的同质性最大化和类间对象的异质性最大化 12)P1是随机变量,并且有P1~P(0,1),那么P12按照(卡方)分布。
13)在对数线性模型中,要先将概率取对数,再分解处理,公式:P PP=PPP PP= ,P,P=P,P PPP P+PPP.P+PP P PP P P P P 14)将每个原始变量分解为两片面因素,一片面是由全体变量共同具有的少数几个公共 因子组成的,另一片面是每个变量自身具有的因素,即特殊因子 15)判别分析的最根本要求是分组类型在两组之上,每组案例的规模务必至少一个以上, 解释变量务必是可测量的 16)当被解释变量是属性变量而解释变量是度量变量时判别分析是适合的统计分析方法 17)多元正态分布是一元正态分布的推广 18)多元分析的主要理论都是建立在多元正态总体根基上的,多元正态分布是多元分析的 根基 19)因子分析中,把变量表示成各因子的线性组合,而主成分分析中,把主成分表示成各 变量的线性组合 20)统计距离包括欧氏距离和马氏距离两类 1)因子负荷量是指因子布局中原始变量与因子分析时抽取出的公共因子的相关程度 (√)(p147) 2)主成分分析是将原来较少的指标扩展为多个新的综合指标的多元统计方法p24) 3)判别分析其被解释变量为属性变量,解释变量是度量变量。
√)(p90) 4)Logistic回归对于自变量有要求,度量变量或者非度量变量都不成以举行回归 (p220) 5)在系统聚类过程中,聚合系数越大,合并的两类差异越小 (P59) 6)spss只能对单变量举行正态性检验√) 7)Logistic回归中的估计参数(P0,P1,P2,… ,P P)回响优势比率的变化,假设P P 是正的,它的反对数值(指数)确定小于1228) 8)密度函数可以是负的 (p3) 9)计算典型函数推导的典型权重有较小的不稳定性p205) 10)10、对应分析可以用图形的方式提示变量之间的关系,同时也可以给出概括的统计量 来度量这种相关关系,使研究者在作用对应分析时得到主观性较强的结论p179) 11)多元检验具有概括和全面考察的特点,轻易察觉各指标之间的关系和差异p25 12)名义尺度的指标用一些类来表示,这些类之间有等级关系,但没有数量关系 p43 13) k-均值法是一种非谱系聚类法(√)p44 14)一般而言,不同聚类方法的结果不完全一致(√)p6 15)判别分析最根本要求是分组类型在两组以上且解释变量务必是可测量的(√)p90 16)非谱系聚类法是把变量聚集成k个类的集合。
p64 17)主成分的数目大大少于原始变量的数目√)p114 18)因子分析只能用于研究变量之间的相关关系p143 19)聚类分析中的分类方法中,系统聚类法和分解法好像(相反)P43 20)聚类分析的目的就是把好像的研究对象归类√)P42 B卷 一、填空题 1. 因子分析中因子载荷系数P PP的统计意义是第i个变量与第j个公因子的相关系数;(P146) 2. 类平均法的两种形式为组间联结法和组内联结法(P56) 3. 设3~(,),i 1,2,10.i x x μ∑=???那么10 1()~i i W x μ==-∑3(10)W ∑, (p5) 4.聚类分析根据实际的需要可能有两个方向,一是对样品,一是对指标聚类P43) 5. 模糊聚类分析方法中对原始数据举行变换,变换方法通常有标准化变换,极差变换,对数变换 (p63) ()2 212121212 1~(,),(,),(,),,1X N X x x x x x x ρ μμμμσ ρ ∑==∑=+-6、设其中那么Cov(,)=0 7.非谱系聚类法是把样品聚集成K 个类的集合。
P64) 8.因子分析的根本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组间的相关性较低P142) 9.两总体均值的对比问题也可分为两总体协方差阵相等与两总体协方差不相等两种情形P25) 10.因子旋转分为正交旋转和斜交旋转P150) 11. Q 型聚类是指对样品举行聚类,R 型聚类是指对指标(变量)举行聚类42页) 12. 一元回归的数学模型是: y =β0+β1x +ε,多元回归的数学模型是:_y =β0+β1x 1+β2x 2+ βp x p +ε_ 13. 变量的类型按尺度划分有间隔尺度、有序尺度、名义尺度_. (43页) 14. 判别分析是判别样品所属类型的一种统计方法,常用的判别方法有距离判别法、Fisher 判别法、Bayes 判别法、逐步判别法80页) 15若12112~(,),,~(,),0,p p p W n n W n A A ∑≥∑∑,且A 1和A 2相互独立,那么 112~A A A +12p n n Λ(,,). 19页) 16. 对应分析是将R 型因子分析和Q 型因子分析结合起来举行的统计分析方法。
170页) 17. 典型相关分析是研究两组变量之间相关分析的一种多元统计方法194页) 18. 判别分析适用于被解释变量是非度量变量的情形 19. 主成分分析是利用降维的思想,在损失很少信息的前提下,把多个指标转化为几个综合指标的多元统计方法113页) 20. 设i x ,1,2,16i =???是来自多元正态总体(,)p N μ∑,X 和A 分别为正态总体 (,)p N μ∑的样本均值和样本离差阵,那么2115[4(X )][4(X )]~T A μμ-=--2(15P)T , 或 二、判断题 1、 对于任何随机向量X=21)X ...,X X p ,,(来说,其协方差阵∑都是对称阵,同时 总是非负定的 ( T ) P5 2、 能够表达各个变量在变差大小上的不同,以及有时存在的相关性还要求 距离与各变量所用的单位无关,这种距离是欧式距离 F )P7 3、 最长距离法中,选择最小的距离作为新类与其他类之间的距离,然后将类间距离最小的两类举行合并,一向合并到只有一类为止 ( F )P55 4、 当总体21G G 和为正态总体且协方差相等时,选用马氏距离。
T )P90 5、 举行主成分分析的目的之一是裁减变量的个数,所以一般不会去p 个主 成分,而是取m(mp)个主成分 T )P119 6、 第k 个主成分k Y 与原始变量i X 的相关系数 (k Y ,i X )称为因子负荷量 ( T )P120 7、 F=’),,(m 21F ......,F F (mp )是不成观测的变量,其均值向量E (F )=0,协方 差矩阵cov(F)=I,即向量F 的各分量不是相互独立的 (F )P145 8、 每个典型函数都包括一对变量,通常一个代表自变量,另一个代表因变量T )P202 9、 分组数据的Logistic 回归不仅适用于大样本的分组数据,对小样本的未分组数据也适用F )P232 10、 一个未知参数可以由显变量的协方差矩阵的一个或多个元素的代数函数来表达,就称这个为参数可识别 (T )P264 11、 随机向量 的协方差阵确定是对称的半正定阵T )P5 12、 标准化随机变量的协方差阵与原变量的相关系数一致 T )P5 13、 对应分析回响的是列变量与行变量的交错关系 F )P170 14、 若一个随机向量的任何边缘分布均为正态,那么它是多元正态分布。
T )p10 15、特征函数描述空间的元素之间是否有关联,而隶属度描述了元素之间的关联是多少 T )p62 16、 非谱系聚类法是把变量聚集成K 个类的集合 F )p64 17、在对因素A 和因素B 举行对应分析之前没有必要举行独立性检验 T )p173 18、系统聚类法中的“离差平方和法”的根本思想来源于假设类分得正确,同类样品的离差平方和理应较小,类与类之间的离差平方和理应较大 T ) p57 19、距离判别法对总体的分布没有特定的要求T)p90 20、 Wilks统计量可以化成T2统计量但是化不成F统计量F)p18 — 9 —。
