
多元统计分析案例分析.doc
11页一、对我国30个省市自治区农村居民生活水平作聚类分析1、指标选择及数据:为了全面分析我国农村居民的生活状况,主要考虑从收入、消费、就业等几个方面对农村居民的生活状况进展考察因此选取以下指标:农村产品价格指数、农村住宅投资、农村居民消费水平、农村居民消费支出、农村居民家庭人均纯收入、耕地面积及农村就业人数现从2010年的调查资料中抽取30个样本,指标数据如下:地区农产品价格指数〔上年=100〕农村住宅投资〔亿元〕农村居民消费水平〔元〕农村居民生活消费支出合计〔元〕农村居民家庭人均纯收入〔元〕耕地面积2021〔万公顷〕农村私营企业就业人数〔万人〕98.27 93.04 12886 9254.8 13262 231.7 153.9 **103.03 48.31 7814 4936.7 10075 441.1 8.0 **99.70 441.75 3867 3844.9 5958 6317.3 80.9 **100.43 168.71 4500 3663.9 4736 4055.8 51.7 **99.83 33.17 4486 4460.8 5530 7147.2 18.4 **102.90 162.05 5739 4489.5 6908 4085.3 99.5 **103.77 71.65 4663 4147.4 6237 5534.6 21.2 **98.07 126.45 4536 4391.2 6211 11830.1 42.8 **102.23 2.12 13609 10210.5 13978 244.0 258.4 **99.92 284.55 8196 6542.9 9118 4763.8 569.8 **100.25 513.75 9878 8928.9 11303 1920.9 398.3 **99.08 412.48 4447 4013.3 5285 5730.2 105.9 **98.04 176.35 6879 5498.3 7427 1330.1 113.1**96.81 236.53 4397 3911.6 5789 2827.1 173.2 **101.23 566.90 5733 4807.2 6990 7515.3 273.6 **99.07 729.47 4061 3682.2 5524 7926.4 137.7 **96.30 210.06 4758 4090.8 5832 4664.1 66.4 **90.61 298.41 45134310.4 5622 3789.4 104.5 **94.95 337.44 5880 5515.6 7890 2830.7 124.4 **89.25 248.80 3561 3455.3 4543 4217.5 89.0 **101.91 26.22 3846 3446.2 5275 727.5 5.3 **88.99 80.12 3652 3624.6 5277 2235.9 36.7675**96.94 456.10 4748 3897.5 5087 5947.4 140.3 **96.11 137.22 2926 2852.5 3472 4485.3 25.4 **96.50 158.97 3603 3398.3 3952 6072.1 41.3 **95.83 151.79 3683 3793.8 4105 4050.3 1.7 **100.22 97.33 2975 2942.0 3425 4658.8 22.0 **94.61 63.63 3684 3863 542.7 10.5 11.4 **99.39 29.51 3894 4675 1107.1 43.6 16.7 **92.87 79.35 3590 3457.9 4643 4124.6 18.7 数据来源:"中国统计年鉴2021".2、将数据进展标准化变换:地区农产品价格指数〔上年=100〕农村住宅投资〔亿元〕农村居民消费水平〔元〕农村居民生活消费支出合计〔元〕农村居民家庭人均纯收入〔元〕耕地面积2021〔万公顷〕农村私营企业就业人数〔万人〕0.09 -0.67 2.82 2.53 2.37 -1.36 0.37 **1.33 -0.91 0.92 0.15 1.30 -1.29 -0.78 **0.47 1.24 -0.56 -0.46 -0.07 0.84 -0.21 **0.65 -0.25 -0.33 -0.56 -0.48 0.02 -0.44 **0.50 -0.99 -0.33 -0.12 -0.21 1.15 -0.70 **1.30 -0.29 0.14 -0.10 0.25 0.03 -0.06 **1.52 -0.78 -0.26 -0.29 0.02 0.56 -0.68 **0.04 -0.48 -0.31 -0.15 0.01 2.84 -0.51 **1.12 -1.16 3.09 3.06 2.60 -1.36 1.20 **0.52 0.38 1.06 1.04 0.98 0.28 3.66 **0.61 1.64 1.69 2.35 1.71 -0.75 2.31 **0.30 1.08 -0.35 -0.36 -0.30 0.63 -0.01 **0.04 -0.21 0.57 0.46 0.42 -0.97 0.05 **-0.28 0.12 -0.36 -0.42 -0.13 -0.42 0.52 **0.86 1.93 0.14 0.08 0.27 1.28 1.32 **0.30 2.82 -0.49 -0.55 -0.22 1.43 0.24 **-0.42 -0.03 -0.23 -0.32 -0.11 0.24 -0.32 **-1.89 0.46 -0.32 -0.20 -0.18 -0.07 -0.02 **-0.77 0.670.19 0.47 0.57 -0.42 0.14 **-2.24 0.19 -0.68 -0.67 -0.54 0.08 -0.14 **1.04 -1.03 -0.57 -0.68 -0.30 -1.18 -0.81 **-2.31 -0.74 -0.64 -0.58 -0.30 -0.64 -0.56 **-0.25 1.32 -0.23 -0.43 -0.36 0.71 0.26 **-0.46 -0.42 -0.92 -1.00 -0.90 0.18 -0.65 **-0.36 -0.31 -0.66 -0.70 -0.74 0.75 -0.52 **-0.54 -0.34 -0.63 -0.48 -0.69 0.02 -0.83 **0.60 -0.64 -0.90 -0.96 -0.92 0.24 -0.67 **-0.85 -0.83 -0.63 -0.45 -1.88 -1.44 -0.76 **0.39 -1.01 -0.55 0.00 -1.69 -1.43 -0.71 **-1.30 -0.74 -0.67 -0.67 -0.51 0.05 -0.70 3、用K-均值聚类法对样本进展分类如下:聚类成员案例号地区聚类距离11 1069.19 2**2 3060.35 3**3 920.65 4**4 1506.42 5**3 577.12 6**2 2453.89 7**3 1487.95 8**3 5006.41 9**1 2094.38 10**2 2853.42 11**1 3015.14 12**3 1204.49 13**2 1612.46 14**4 1880.40 15**3 2088.55 16**3 1282.27 17**3 2230.15 18**4 2053.35 19**2 1119.98 20**4 1412.14 21**4 2541.05 22**4 1423.51 23**3 1138.14 24**4 2025.41 25**3 2196.63 26**4 1127.91 27**4 2123.67 28**4 4568.60 29**4 4247.12 30**4 1360.50 分四类的情况下,最终分类结果如下:第一类:、**、**。
第二类:**、、**、、**、**、**、**第三类:**、**、**、**、**、**、**、**、**、**、**第四类:**、**、**、**、**、**、**、**、**、**、从分类结果上看,根据2010年的调查数据,第一类地区的农民生活水平较高,第二类属于中等水平,第三类、第四类属于较低水平二、判别分析针对以上分类结果进展判别分析其中将**作作为待判样本判别结果如下:案例数目实际组预测组p1110.9982220.5753330.9974440.3615330.83662。
