判别分析实验报告SPSS.docx
13页实验目的及要求:1、目的用 SPSS 软件实现判别分析及其应用2、内容及要求用 SPSS 对实验数据利用 Fisher 判别法和贝叶斯判别法,建立判别函数并判定宿州、广安等 13个地级市分别属于哪个管理水平类型二、仪器用具:仪器名称规格/型号数量备注计算机1有网络环境SPSS软件1三、实验方法与步骤:准备工作:把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中,同时,由于只有当被解释变量是属性变量而解释变量是度量变量时,判别分析才适用所以将城市管理的7个效率指数变量的变量类型改为"数值:N), 度量标准改为“度量(S)",以备接下来的分析实验结果与数据处理:表1 组均值的均等性的检验Wilks 的LambdaFdf1df2Sig.综合效率标准指数.58223.022264.000经济效率标准指数.40646.903264.000结构效率标准指数.9541.560264.218社会效率标准指数.7968.225264.001人员效率标准指数.34261.645264.000发展效率标准指数.30871.850264.000环境效率标准指数.9133.054264.054表 1 是对各组均值是否相等的检验,由该表可以看出,在 0.05 的显著性水平 上我们不能拒绝结构效率标准指数和环境效率标准指数在三组的均值相等的假设, 即认为除了结构效率标准指数和环境效率标准指数外,其余五个标准指数在三组的 均值是有显著差异的。
表2 对数行列式group秩对数行列式16-33.41026-33.17736-40.584汇聚的组内6-32.308打印的行列式的秩和自然对数是组协方差矩阵的秩和自然对数验结箱的M140.196F近似2.498df142df21990.001Sig..000对相等总体协方差矩阵的零假设进行检验以上是对各组协方差矩阵是否相等的Box' M检验,表2反映协方差矩阵的秩 和行列式的对数值由行列式的值可以看出,协方差矩阵不是病态矩阵表3 是对 各总体协方差阵是否相等的统计检验,由 F 值及其显著水平,在 0.05 的显著性水 平下拒绝原假设,认为各总体协方差阵不相等1)Fisher 判别法:图一園判别分析:统计星冈组內相夫迟)组向协方差世) 分泪协石盍目 □总讣协方羞©「推迷哼 g 单ANOVA(A)2 Box's M(B)「羽劑系劑 S Fisher(F)2未桩妊化P图二表4 特征值函数特征值方差的%累积%正则相关性13.763a75.075.0.88921.257a25.0100.0.746a.分析中使用了前2个典型判别式函数表5 Wilks 的 Lambda函数检验Wilks 的 Lambda卡方dfSig.1到2.093146.04212.0002.44350.0535.000表 4 反映了判别函数的特征值、解释方差的比例和典型相关系数。
第一判别函数解释了 75%的方差,第二判别函数解释了25%的方差,它们两个判别函数解释了全部方差表 5 是对两个判别函数的显著性检验,由 Wilks'Lambda 检验,认为两个判别函数在 0.05 的显著性水平上是显著的表6 标准化的典型判别式函数系数函数12综合效率标准指数-.228-.578经济效率标准指数.566.404结构效率标准指数.097.472社会效率标准指数.378.233人员效率标准指数-.3281.099发展效率标准指数.621.675表7 结构矩阵函数12发展效率标准指数.752*.305经济效率标准指数.611*.222综合效率标准指数.426*.170社会效率标准指数.261*-.001环境效率标准指数a.141*-.129人员效率标准指数-.547.797*结构效率标准指数.070-.156*判别变量和标准化典型判别式函数之间的汇聚组间相关性按函数内相关性的绝对大小排序的变量每个变量和任意判别式函数间最大的绝对相关性a.该变量不在分析中使用表 6 为标准化的判别函数,表7 为结构矩阵,即判别载荷由判别权重和判别 载荷可以看出发展效率标准指数、经济效率标准指数对判别函数1 的贡献较大,而 人员效率标准指数对判别函数 2 的贡献较大。
函数12综合效率标准指数-5.216-13.231经济效率标准指数5.1683.688结构效率标准指数.9994.848社会效率标准指数4.8773.011人员效率标准指数-3.31911.138发展效率标准指数7.1457.774(常量)-1.363-6.424表8典型判别式函数系数非标准化系数表9 组质心处的函数group函数121-.210-.73023.9641.2633-2.7251.905在组均值处评估的非标准化典型判别式函数表8为非标准化的判别函数,我们可以根据这个判别函数计算每个观测的判别Z 得分表9反映判别函数在各组的重心根据结果,判别函数在group=1这一组的 重心为(-0.210,-0.730 ),在group=2这一组的重心为(3.964,1.263 ),在group=3 这一组的重心为(-2.725,1.905 )这样,我们就可以根据每个观测的判别Z得分将观测进行分类表10 组的先验概率group先验用于分析的案例未加权的已加权的1.3334646.0002.3331010.0003.3331111.000合计1.0006767.0000表11 分类结果b,cgroup预测组成员合计123初始计数14600462010010320911未分组的案例63312%1100.0.0.0100.02.0100.0.0100.0318.2.081.8100.0未分组的案例50.025.025.0100.0交叉验证a计数1450146219010320911%197.8.02.2100.0210.090.0.0100.0318.2.081.8100.0a. 仅对分析中的案例进行交叉验证。
在交叉验证中,每个案例都是按照从该案例以外的所有其他案例派生的函数来分类的b. 已对初始分组案例中的97.0%个进行了正确分类c. 已对交叉验证分组案例中的94.0%个进行了正确分类表10为各组的先验概率,在分类选项中选择的是所有组的先验概率相等表11为分类矩阵表,这里交叉验证是采用“留一个在外”的原则,即每个城市 是通过除了这个城市以外的其他城市推导出来的判别函数来分类的由该表可以看 出,通过判别函数预测,有65个城市是分类正确的,其中,group=1组46个城市 全部被判对,group=2组的10个城市也全部被判对,group=3组11个城市中有9 个被判对,即有97%的原始城市被判对在交叉验证中,三组中分别有45、9、9 个城市被判对,交叉验证有94%的城市被判对典则判别甫数groupA 1A2§ 3来分爼的案働南数1图三图三为分类结果图,从图中可以看到第2组与第3组可以很清晰地分开,与第1 组也能分开,而第3组和第1组存在重合区域,即存在误判同时,根据对待判城市的判别可以看出:在13个待判城市中,宿州、广安、河地被判到了第3组,佛山、苏州、东营被判到了第2组,咸阳、盘锦、汉中、保定、 宝鸡、衡阳被判到了第1组,而以纯由于只有环境效率标准指数的值,其他变量值 确实,系统未对其进行判别。
2)贝叶斯判别法:園判别分析:统计最揃述性矩阵厨绡内相生迟)回单娈量ANOVAfA)纟目內协方圭世)Box's分组协方建匡)国数系数总体协方差①SJ Fistier(F)1 1禾标准化图四图五贝叶斯判别法输出的结果与Fisher判别法很大程度上是一致的,这里不再列出group先验用于分析的案例未加权的已加权的1.6874646.0002.1491010.0003.1641111.000合计1.0006767.0000表13 分类函数系数group123综合效率标准指数-89.225-137.370-110.980经济效率标准指数18.31847.23615.041结构效率标准指数112.414126.246122.679社会效率标准指数61.50987.86457.179人员效率标准指数77.41985.768115.125发展效率标准指数57.663102.98060.184(常量)-46.457-74.840-66.632Fisher的线性判别式函数表12为各族的先验概率,在分组选项中选择的是“根据组大小计算”表13展示了每组的分类函数,也称费歇线性判别函数,由表中的结果可以说明:group=1这一组的分类函数为:f1=- 46.457-89.225综合效率标准指数+18.318经济效率标准指数+112.414结构效率标准指数+61.509社会效率标准指数+77.419人员效率标准指数+57.663发展效率标准指数其他两组的分类函数同样可以写出,我们可以根据每个城市在各组的分类函数值然后将城市分类到较大的分类函数值中。
表 14 为贝叶斯判别的分类结果,其交叉验证有 95.5%的城市被判对,这一概 率比 Fisher 判别要高表14 分类结果b,cgroup预测组成员合计123初始计数14600462010010320911未分组的案例63312%1100.0.0.0100.02.0。





