好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

统计学基础 第8章教材课件.pptx

44页
  • 卖家[上传人]:清晨86****784
  • 文档编号:266517537
  • 上传时间:2022-03-15
  • 文档格式:PPTX
  • 文档大小:10.77MB
  • / 44 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 统计学STATISTICS第八章第八章 方差分析方差分析统计学STATISTICS第八章第八章 方差分析方差分析 如果你是一位农民,你可能会关心不同品种、不同地块的农作物收获会有何不同,影响收成的因素可以列举出很多,如土地的肥沃程度、降水、气温、种子质量、耕作方式等等,你肯定很想知道各个因素是如何影响收成的;如果你是一位体育教练,你可能会关心影响运动员成绩的各种因素,如运动员个人的特质、训练条件、训练的刻苦程度、心理素质、比赛状态、所选项目等等;如果你是一位零售商,又会关心卖场的位置、规模、定位、激励机制等等对企业经营状况的影响在这些事例中,如农作物的产量、运动员的成绩、商场零售额等,都是我们感兴趣的对象,且都可以定量描述统计学STATISTICS第八章第八章 方差分析方差分析 它们有一个共同之处,同时受到众多因素的影响,我们可以按照习惯将这些影响变量称为自变量,被影响的变量称为因变量如何分析各个自变量对因变量的影响呢?这就是接下来我们要分析的问题有的影响变量是数值型的,如降水、气温、训练的时间长短、卖场的规模大小等等,这些定量变量对自变量的影响或曰贡献是相关与回归分析要研究问题,我们放在下一章介绍。

      有的影响变量是定性变量,如农作物的品种和耕作方式、运动员的比赛项目、卖场的位置及定位等等,分析定性变量对某一定量变量影响的方法就是本章要介绍的方差分析统计学STATISTICS第八章第八章 方差分析方差分析 8.1 方差分析的基本思想 8.2 单因素方差分析 8.3 双因素方差分析简介统计学STATISTICS本章学习目标 了解方差分析可以解决的问题 知道方差分析的基本思想 知道方差分析的应用条件 掌握单因素方差分析的主要步骤,并可以在实现单因素的方差分析统计学STATISTICS8.1 方差分析的基本思想 8.1.1误差的分解 8.1.2方差分析的应用条件统计学STATISTICS8.1 方差分析的基本思想在第七章总体参数的假设检验中,我们看过这么一个材料,教育研究工作者想分析小学生上课外班的效果,他分别从没有上班的学生中和上班的学生中各随机抽取50名学生进行测试,通过比较两组学生测试的平均成绩来判断班的效果为什么通过比较平均数能够判断上班是否有效?如何分析是否上班(这是个变量)与成绩(这也是一个变量)间的关系呢?我们来看图8.1:图8.1成绩影响因素示意图统计学STATISTICS随机误差随机误差 图8.1说明,影响成绩的因素有很多,我们可以划分为两类: 一是小学生的个人资质、家庭背景、勤奋程度等,这些因素只与学生个人有关,与上不上班无关,在上班的学生中有个人资质好一些的,也有差一些的,没上班的学生中也有好一些的和差一些的,我们可以假设这些因素对两个总体中的个体是有影响的,但不会影响总体的平均水平,对总体来讲,个体间的这些差异会互相抵消,我们称这些因素产生的影响为随机误差随机误差。

      对于分别来自这两个总体的样本,这些因素同样存在,来自第一个总体(未上班的学生)的样本,其内部各学生间也存在这些差异,有的因素在有的学生身上起正面的作用,使测试成绩好一些,有的起负面作用,使测试成绩低一些随机误差不但存在于样本中的个体之间,也存在于随机抽取的样本与总体之间,这些因素不会决定样本的平均成绩,但会有所影响,抽到不同的样本会有不同的平均成绩统计学STATISTICS系统误差系统误差 第二个因素是班,在第一个总体中,所有学生都是未上班的,他们之间测试成绩的差异不存在班这个因素的影响,来自该总体的样本中的个体成绩之间的差异,也不会受到班因素的影响而在第二个总体中,所有学生都是上班的,在他们之间测试成绩也有差异,这个差异不会受到上班这个因素的影响,因为对他们来讲,这个条件是一致的同样,来自该总体的样本中的个体成绩之间的差异,也不会受到班的影响但在这两个总体之间或两个样本之间,在班这个条件上是不相同的,第一个总体的平均成绩或来自该总体的样本的平均成绩不会受到班的影响,而第二个总体的平均成绩或来自该总体的样本的平均成绩会受到班的影响也就是说,在造成 与 之间的差异,除随机误差以外,还存在是否上班因素的影响,由于第一个样本中的个体均不受班的影响,第二个样本中的个体均受到班的影响。

      所以我们可以认为 中包含有随机误差,也含有班这个因素的影响,我们将班这个因素产生的误差称为系统误差系统误差因为随机误差对 、 影响相差无几,所以我们认为,如果 与 相差不大,就不存在系统误差,如果二者相差较大,就说明不只有随机误差,一定还有系统误差这就是我们在假设检验中根据样本均值差的大小程度来判断两个总体的均值是否相等,进而对某因素是否有影响作出判断的道理统计学STATISTICS 对于上述事例,总体只有两个,未上班的学生和上班的学生,我们通过假设检验对 与 是否相等作出判断但是,在现实中,有很多情况并非只有两种选择,如零售商卖场的地理位置,可以选择在商业街、居民区、CBD、开发区等不同街区如果我们要研究不同街区对卖场的经营是否存在影响,利用参数检验的方法,就需要两两判断它们的均值是否相等,即对 等分别检验,需要做3次,显得很麻烦这时,就需要方差分析了 方差分析方差分析是分析定性自变量对定量变量影响的统计分析方法它是通过针对不同水平定性自变量下的数据的差异分解,来判断多个总体均值是否相等,进而分析定性自变量对研究对象是否存在影响的统计分析方法 统计学STATISTICS8.1.1误差的分解我们以零售商处于不同位置卖场的月人均销售额为例,解释方差分析的基本思路。

      其实,方差分析与上述班是否有效的分析思路基本一致,是将不同卖场月人均销售额的差异因素分为员工素质、天气状况等随机误差和由于地理位置不同产生的系统误差例8.1】为了研究地理位置对商场销售额影响,研究者分别调查了商业街(9家)、居民区(7家)CBD(8家)和开发区(7家)共31家零售商,调查得人均月销售额数据(数据:8.1sc.xlsx)如表8.1所示:地理位置商业街居民区CBD开发区样样本编编号1211118122259161531815242041816189516181514624201816728161610822-10-924-表8.1 不同位置商场人均月销售额 单位:万元统计学STATISTICS8.1.1误差的分解方差分析:单因素方差分析SUMMARY组观测数求和平均方差商业街919621.7777815.19444居民区71051514.66667CBD813516.87515.26786开发区79613.7142914.2381方差分析差异源SSdfMSFP-valueF crit组间308.33443102.77816.9054290.0013432.960351组内401.85912714.88367总计710.193530数据8.1sc.xlsx统计学STATISTICS8.1.1误差的分解 在这个问题中,我们研究的是地理位置对销售额的影响,地理位置是自变量,是定性变量,在方差分析中称为因子因子,不同的地理位置称为因子的水平水平,在例8.1中因子地理位置有商业街、居民区等4个水平。

      销售额是因变量,是数值型变量,方差分析的目的就是要解决定性自变量对定量因变量是否有影响的问题 由表8.1知,即是在同一个地理位置下,不同商场人均销售额也不尽相同,有的高一些,有的低一些,这些差异是由地理位置以外的各种因素造成的,如员工的素质等随机因素,这些随机因素对于不同地理位置的商场都有影响,这种差异就是随机误差随机误差,也称为组内误差组内误差或残差残差,它反映了各样本数据内部的差异不同地理位置的商场之间也存在差异,这些差异有可能是抽样时产生的随机误差,也可能是不同地理位置造成的系统误差,不同地理位置间商场人均销售额的差异称为组间误差组间误差,也称为处理误差处理误差,反映组间数据的差异统计学STATISTICS8.1.1误差的分解 组内误差仅包括随机误差,组间误差即包含随机误差,也包含系统误差不难理解如果各组平均数相差较大,组间误差远远大于组内误差,说明存在系统误差,表明地理位置对商场人均销售额有明显影响如果地理位置对商场经营没有影响,不存在系统误差,组间误差仅由随机误差组成,各组平均数就不会出现较大差距,组间误差与组内误差将会接近所以我们可以通过比较组内误差与组间误差来判断地理位置对商场销售额是否存在影响。

      换一种说法,方差分析实际上是判断数据间差异的来源,如果误差主要来源于偶然因素,不同地理位置的人均销售额应该差不多,就不能否定总体上不同地理位置的商场人均销售额相等如果数据间的差异主要来源于地理位置,不同地理位置的商场人均销售额相差较大,大到一定程度就说明地理位置对商场的人均销售额有影响,不同地理位置的商场人均销售额不等由此可知,将方差分析表述为:方差分析是对多个总体均值是否相等的检验,或者说方差分析是对定性变量对某一定量研究对象是否存在影响的检验,这两种说法是一致的其误差分解如图8.2所示:统计学STATISTICS图8.2 误差分解示意图统计学STATISTICS组内离差平方和在方差分析中,数据间的误差大小是用各数据对平均数的离差平方和度量的,不同的离差平方和反映不同因素的影响,也称为效应组内数据间的差异用组内离差平方和表示,是因子在同一水平下的样本观察值与其平均数的离差平方和,反映组内各观察值的离散程度该离差平方和不包括因子的变化成分,是对随机误差的单纯度量反映随机因素对因变量的影响,也称为残差效应如位于商业街的9家商场零售额的平均值为21.78,离差平方和为:统计学STATISTICS组内离差平方和 (8.1)统计学STATISTICS组间离差平方和 统计学STATISTICS组间离差平方和 (8.2)统计学STATISTICS总的离差平方和在方差分析中,组内离差平方和与组间离差平方和的总和就是所有数据与总平均数的离差平方和,通常将其记为SST ,反映所有观察值的离散程度。

      其计算公式为:例8.1中,全部观察值的离差平方和为由此可知:(8.3)(8.4)统计学STATISTICS 8.1.2方差分析的应用条件 由上文分析知,方差分析实际上对在不同因子水平下的均值是否相等的检验,检验统计量是由离差平方和构造的 统计量,这就要求数据符合正态性、方差齐性和独立性三个假定1.正态性 正态性是指对于每一个不同的因子水平,总体服从正态分布,即不同因子水平下的观察值都是来自正态分布总体的简单随机样本 如图8.2中所显示的总体一,总体二和总体三都要求服从正态分布在例8.1,要求所有在商业街经营的零售商的人均月销售额要服从正态分布2.方差齐性 方差齐性是指对应于每一个不同的因子水平,其正态总体的方差都相等在图8.2中就是总体一,总体二和总体三都具有相等方差,即 3.独立性 独立性是指样本间是相互独立的,即每个样本数据是来自因子在不同水平下的独立样本如例8.1中,位于商业街的9家商场的抽取与位于居民区的7家商场的抽取是独立进行的统计学STATISTICS8.2 单因素方差分析单因素方差分析就是只考虑一个定性自变量的方差分析如上例8.1中,研究的因子只有一个:地理位置,分析不同的地理位置是否会影响商场的人均月销售额。

      单因素方差分析的主要步骤为: 数据准备 假设的陈述 检验统计量的构造 作出统计决策统计学STATISTICS8.2.1数据准备 统计学STATISTICS8.2 单因素方差分析数据结构因 子水平1水平2水平k 样样本编编号1X11X21Xk12X12X22Xk2.nX1nX2nXkn像表8.1显示了不同地理位置的商场数据,满足方差分析的需要统计学STATISTICS8.2.2假设的陈述 正如上文所述,方差分析就是通过判断在不同因子水平下总体的均值是否相等,分析定性自变量即因子是否对研究对象产生影响的分析方法。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.