好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

多元统计分析第二章部分课后习题.doc

7页
  • 卖家[上传人]:平***
  • 文档编号:14012053
  • 上传时间:2017-10-27
  • 文档格式:DOC
  • 文档大小:268.03KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第二章课后习题1.现选取内蒙古、广西、贵州、云南、西藏、宁夏、新疆、甘肃和青海等 9 个内陆边远省区选取人均 GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占 15 岁以上人口等五项能够较好的说明各地区社会经济发展水平的指标,验证一下边远及少数民族聚居区的社会经济发展水平与全国平均水平有无显著差异边远及少数民族聚居区社会经济发展水平的指标数据地区人均GDP(元)三产比重(%)人均消费(元)人口增长(%)文盲半文盲(%)内蒙古 5068 31.1 2141 8.23 15.83广西 4076 34.2 2040 9.01 13.32贵州 2342 29.8 1551 14.26 28.98云南 4355 31.3 2059 12.1 25.48西藏 3716 43.5 1551 15.9 57.97宁夏 4270 37.3 1947 13.08 25.56新疆 6229 35.4 2745 12.81 11.44甘肃 3456 32.8 1612 10.04 28.65青海 4367 40.9 2047 14.48 42.92资料来源:《中国统计年鉴(1998) 》 ,北京,中国统计出版社,1998。

      五项指标的全国平均水平为: )15.78 9.27 3.8 01.62(0 解:(1)先利用 SPSS 软件检验各变量是否遵从多元正态分布(见输出结果 1-1)输出结果1-1正态性检验Kolmogorov-Smirnova Shapiro-Wilk统计量 Df Sig. 统计量 df Sig.人均GDP .219 9 .200* .958 9 .781三产比重 .145 9 .200* .925 9 .437人均消费 .209 9 .200* .873 9 .131人口增长 .150 9 .200* .949 9 .682文盲半文盲 .246 9 .124 .898 9 .242*. 这是真实显著水平的下限a. Lilliefors 显著水平修正上表给出了对每一个变量进行正态性检验的结果,因为该例中样本数 n=9,所以此处选用 Shapiro-Wilk 统计量则 Sig.值分别为0.781、0.437、0.131、0.682、0.242 均大于显著性水平,由此可以知道,人均 GDP、三产比重、人均消费、人口增长、文盲半文盲这五个变量组成的向量均服从正态分布,即我们认为这五个指标可以较好对各地区社会经济发展水平做出近似的度量。

      2)提出原假设及备选假设 00:H1(3)做出统计判断,最后对统计判断作出具体的解释SPSS 的 GLM 模块可以完成多元正态分布有关均值与方差的检验依次点选Analyze General Linear Mode lMultivariate……进入 Multivariate 对话框,将人均 GDP、第三产业比重、人均消费支出、人口自然增长率及文盲半文盲人口占 15 岁以上人口等这五项指标选入 Dependent 列表框,将分类指标选入Fixed Factor(s)框,点击 OK 运行,则可以得到如下结果(见输出结果 1-2) 输出结果1-2主体间因子值标签 N1.00 边远及少数民族聚居区社会经济发展水平 9分类2.00 全国经济平均发展水平 1多变量检验 a效应 值 F 假设 df 误差 df Sig.Pillai 的跟踪 .990 81.986b 5.000 4.000 .000Wilks 的 Lambda .010 81.986b 5.000 4.000 .000Hotelling 的跟踪 102.482 81.986b 5.000 4.000 .000截距Roy 的最大根 102.482 81.986b 5.000 4.000 .000Pillai 的跟踪 .834 4.029b 5.000 4.000 .101Wilks 的 Lambda .166 4.029b 5.000 4.000 .101Hotelling 的跟踪 5.037 4.029b 5.000 4.000 .101分类Roy 的最大根 5.037 4.029b 5.000 4.000 .101a. 设计 : 截距 + 分类b. 精确统计量上面第一张表是样本数据分别来自边远及少数民族聚居区社会经济发展水平、全国的个数。

      第二张表是多变量检验表,该表给出了几个统计量由Sig.值可以看到,无论从哪个统计量来看,两个分类的经济发展水平是无显著差别的实际上,GLM模型是拟合了下面的模型: XY10式中YGDP ( 人 均 第 三 产 业 比 重 人 均 消 费 支 出 人 口 自 然 增 长 率 文 盲 半 文 盲 )X分 类上面多变量检验表实际上是对该线性模型显著性的检验,此处有常数项是因为不能肯定模型过原点而模型没有通过显著性检验,意味着分类中的0不同取值对 Y 的取值无显著影响,也就是说,不同分类的经济发展水平是相同的但是,在实际中,我们往往更希望知道差别主要来自哪些分类,或者不同分类经济发展水平的比较对此,对 GLM 模块的选项作如下设置:在 GLM 主对话框中点击 Contrasts…按钮进入 Contrasts 对话框,在 Change Contrasts 框架中打开 Contrasts 右侧的下拉框并选择 Simple,此时下侧的 Reference Category 被激活,默认是 Last 被选中,表明边远及少数民族聚居区社会经济发展水平与全国平均发展水平作比较,点击 Change 按钮,Continue 继续,OK进行,得到如下结果(见输出结果 1-3)输出结果1-3对比结果(K 矩阵)因变量分类 简单对比 a人均GDP 三产比重人均消费 人口增长文盲半文盲对比估算值 -2003.232 2.274 -1006.111 2.712 12.014假设值 0 0 0 0 0差分(估计 - 假设) -2003.232 2.274 -1006.111 2.712 12.014标准 误差 1129.265 4.912 395.860 2.761 15.688级别 1 和级别 2Sig. .114 .656 .035 .355 .466下限 -4607.321 -9.053 -1918.967 -3.655 -24.162差分的 95% 置信区间 上限 600.857 13.602 -93.256 9.079 48.190a. 参考类别 = 2见输出结果 1-3 表示(1)在显著性水平 的水平下,可以看到 Sig.值分别为0.50.114、0.656、0.035、0.355、0.466,由此我们可以知道边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均消费存在显著差别,即全国的平均人均消费大于边远及少数民族聚居区人均消费,相差值为 1006.111 元。

      人均 GDP、三产比重、人口增长率、文盲半文盲等指标无明显差别2)在显著性水平 的水平下,可以看到 Sig.值分别为0.10.114、0.656、0.035、0.355、0.466 均大于显著性水平 ,我们可以看出边远及少数民族聚居区社会经济发展水平与全国平均发展水平中的人均 GDP、三产比重、人均消费、人口增长率、文盲半文盲等指标无明显差别输出结果1-4多变量检验结果值 F 假设 df 误差 df Sig.Pillai 的跟踪 .834 4.029a 5.000 4.000 .101Wilks 的 lambda .166 4.029a 5.000 4.000 .101Hotelling 的跟踪 5.037 4.029a 5.000 4.000 .101Roy 的最大根 5.037 4.029a 5.000 4.000 .101a. 精确统计量输出结果 1-4 是上面多重比较可信性的度量,由 Sig.值可以看到,比较检验是可信的2、为研究某系列杀虫剂的杀虫效果,随机抽取一批标准试验田分别使用该系列三种不同杀虫剂(1、2、3) ,结果如 spss 所示试比较杀虫剂对玉米和棉花的作用,并分析杀虫剂与农作物是否存在交互作用。

      解:在 SPSS 中依次选择:分析 一般线性模型 多变量后将效果 1 和效果 2 选入因变量中,将杀虫剂和农作物选入固定因子对话框中,在对比对话框中,将杀虫剂用差值进行对比;在绘制中,将杀虫剂选入水平轴,农作物选入单图;将杀虫剂进行两两比较;在选型对话框中进行方差齐性检验,得到以下输出结果:输出结果 2-1主体间因子N1 82 8杀虫剂3 80 12农作物1 12由上表知,杀虫剂共有三类,所含个体数均为 8 个;农作物分为两个,所含个体数均为 12 个输出结果 2-2协方差矩阵等同性的 Box 检验 aBox 的 M 17.133F .812df1 15df2 1772.187Sig. .665检验零假设,即观测到的因变量的协方差矩阵在所有组中均相等a. 设计 : 截距 + 杀虫剂 + 农作物 + 杀虫剂 * 农作物由该表知,检验统计量是 Box’ M,由 Sig.值可以认为观测到的因变量的协方差矩阵在所有组中是均相等的输出结果 2-3误差方差等同性的 Levene 检验 aF df1 df2 Sig.效果 1 1.509 5 18 .236效果 2 .499 5 18 .773检验零假设,即在所有组中因变量的误差方差均相等。

      a. 设计 : 截距 + 杀虫剂 + 农作物 + 杀虫剂 * 农作物由上表知,在显著性水平 位 0.05 下,Sig.值分别为 0.236、0.773,它们均大于 ,则不应该拒绝原假设,即认为效果 1 和效果 2 的误差方差是相等的输出结果 2-4主体间效应的检验源 因变量 III 型平方和 df 均方 F Sig.效果 1 344.708a 5 68.942 20.944 .000校正模型dimension1 效果 2 165.500b 5 33.100 7.401 .001效果 1 1617.042 1 1617.042 491.253 .000截距dimension1 效果 2 1536.000 1 1536.000 343.453 .000效果 1 308.083 2 154.042 46.797 .000杀虫剂dimension1 效果 2 147.250 2 73.625 16.463 .000效果 1 30.375 1 30.375 9.228 .007农作物dimension1 效果 2 16.667 1 16.667 3.727 .069效果 1 6.250 2 3.125 .949 .406杀虫剂 * 农作物dimension1 效果 2 1.583 2 .792 .177 .839效果 1 59.250 18 3.292误差dimension1 效果 2 80.500 18 4.472效果 1 2021.000 24总计dimension1 效果 2 1782.000 24效果 1 403.958 23校正的总计dimension1 效果 2 246.000 23a. R 方 = .853(调整 R 方 = .813)b. R 方 = .673(调整 R 方 = .582)见输出结果 2-4 我们可以知道,在杀虫剂中,效果 1 和效果 2 的 Sig.值均为 0 小于 ,拒绝原假设,我们认为三种类型的杀虫剂在效果 1 和效果 2 上存在显著差别;在农作物中,效果 1 和效果 2 的 Sig.值分别为 0.007、0.069 均大于 ,不应拒绝原假设,即认为两种不同的农作物(玉米和棉花)在效果 1和效果 2 上没有显著差别;在杀虫剂 * 农作物中,效果 1 和效果 2 的 Sig.值分别为 0.406、0.839 均大于 ,不应拒绝原假设,即认为杀虫剂与农作物综合考虑条件下在效果 1 和效果 2 上是没有显著差别的。

      输出结果 2-5@n。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.