好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第8章抽样推断.ppt

146页
  • 卖家[上传人]:cl****1
  • 文档编号:589210834
  • 上传时间:2024-09-10
  • 文档格式:PPT
  • 文档大小:1.52MB
  • / 146 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第八章 抽样推断 n n第一节第一节 抽样推断的概述抽样推断的概述n n第二节第二节 简单随机抽样的参数估计简单随机抽样的参数估计n n第三节第三节 其它常用的抽样组织方式其它常用的抽样组织方式n n第四节第四节 假设检验假设检验 n n第五节第五节 单因素方差分析单因素方差分析 第一节 抽样推断的概述n n一、抽样推断n n二、抽样推断中的几个基本概念n n三、重复抽样与不重复抽样n n四、抽样分布n n五、抽样平均误差 n n一、抽样推断一、抽样推断n n 1 1、抽样推断的定义、抽样推断的定义n n 抽样推断是指依随机的原则,从总体中抽取一抽样推断是指依随机的原则,从总体中抽取一部分单位组成样本,并据样本资料计算样本特征部分单位组成样本,并据样本资料计算样本特征值,再据样本特征值对总体特征值做出具有一定值,再据样本特征值对总体特征值做出具有一定可靠程度的估计,以达到认识总体数量特征的目可靠程度的估计,以达到认识总体数量特征的目的n n 注意如下几点:注意如下几点:n n⑴⑴部分与全部部分与全部n n⑵⑵随机原则随机原则n n⑶⑶部分特征与全部特征的关系。

      部分特征与全部特征的关系n n⑷⑷对总体的认识对总体的认识 n n2、抽样推断的作用特点n n⑴抽样推断是现代统计学的中心内容,抽样调查也是现代社会调查的主要的调查方法之一n n⑵抽样推断的作用不仅是解决了无法进行全面调查问题,还可以节省调查成本n n⑶抽样推断最明显的特点是对抽样产生的误差可以事先计算并可加以控制 3 3、抽样推断的主要内容、抽样推断的主要内容n n 抽样推断的目的并不在于了解样本的数量特征,而是抽样推断的目的并不在于了解样本的数量特征,而是要借助样本的数量特征,来估计和检验总体分布的数量特要借助样本的数量特征,来估计和检验总体分布的数量特征及某些未知因素其主要内容:征及某些未知因素其主要内容:n n1)1)随机抽样随机抽样n n 随机抽样是指按随机的原则从总体中抽取部分单位,构随机抽样是指按随机的原则从总体中抽取部分单位,构成样本的过程成样本的过程n n2)2)统计估计统计估计n n 统计估计是根据随机抽取的部分单位的特性来对总体的统计估计是根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。

      分布函数、分布参数或数字特征等进行推测估算的过程3)3)假设检验假设检验n n 假设检验是指根据经验或不成熟的认识,在的总体的有假设检验是指根据经验或不成熟的认识,在的总体的有关分布函数、分布参数或数字特征等信息作出某种假设的关分布函数、分布参数或数字特征等信息作出某种假设的前提下,为了确定该假设的正确性,而自总体中随机抽取前提下,为了确定该假设的正确性,而自总体中随机抽取部分单位,利用部分与总体间的关系来对所提出的假设作部分单位,利用部分与总体间的关系来对所提出的假设作出判断,以决定是否接受该假设的过程出判断,以决定是否接受该假设的过程 二、有关抽样的基本概念n n(一)样本容量与样本个数 1.样本容量样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数 一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本 2.样本个数样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本 n n(二)总体参数与样本统计量 1.总体参数总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。

      常见的总体参数有:总体的平均数,总体成数(比例),总体分布的方差、标准差它们都是反映总体分布特征的重要指标 2.样本统计量样本统计量是样本的一个函数它们是随机变量我们利用统计量来估计和推断总体的有关参数 常见的样本统计量有:样本平均数,样本比例,样本的方差、标准差 平均数平均数标准差、方差标准差、方差成数成数单位数单位数参数参数  、、 2PN统计量统计量S、、 S2Pn 总体总体 样本样本 三三 、重复抽样与不重复抽样、重复抽样与不重复抽样 四、抽样分布n n抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列主要求出样本平均数的期望与方差)n n包括以下内容•重复抽样分布重复抽样分布n n样本平均数的分布样本平均数的分布n n样本成数的分布样本成数的分布•不重复抽样分布不重复抽样分布n n样本平均数的分布样本平均数的分布n n样本成数的分布样本成数的分布 重复抽样分布--样本平均数的分布n n某班组某班组5 5个工人的日工个工人的日工资为资为3434、、3838、、4242、、4646、、5050元。

      元n n  = 42= 42n n 2 2 = 32= 32n n现用现用放回放回抽样的方法从抽样的方法从5 5人中随机抽人中随机抽2 2个构成样个构成样本共有5 52 2=25=25个样本 n n验证了以下两个结论:验证了以下两个结论:n n抽样平均数的标准差抽样平均数的标准差反映所有的样本平均反映所有的样本平均数与总体平均数的平数与总体平均数的平均误差,称为抽样平均误差,称为抽样平均误差,用均误差,用 表示 n n由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布n n这是一个非常重要的结论,有广泛的应用请参见中心极限定理 n n总体成数总体成数p p是指具有某种特征的单位在总体中的比是指具有某种特征的单位在总体中的比重n n现从总体中抽出现从总体中抽出n n个单位,如果其中有相应特征的个单位,如果其中有相应特征的单位数是单位数是n n1 1,,则样本成数是:则样本成数是: n nP P也是一个随机变量,利用样本平均数的分布性质也是一个随机变量,利用样本平均数的分布性质结论,即有:结论,即有: 不重复抽样分布n n样本均值的分布性质:n n样本成数的分布性质 抽样分布总结样本平均数的分布样本平均数的分布样本成数的分布样本成数的分布重复重复抽样抽样不重复不重复抽样抽样 第二节 参数估计 n n一、参数估计概述n n二、总体均值的估计n n三、总体比例的估计n n四、总体方差的估计 一、参数估计概述n n(一)参数估计的定义与种类 所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。

      例如,估计总体均值,估计总体比例和总体方差等等 参数估计有两种基本形式:点估计和区间估计前者是用一个数值作为未知参数θ的估计值,后者则是给出具体的上限和下限,把 θ包括在这个区间内 n n(二)点估计(二)点估计 点估计,主要有矩估计法和最大似然估计法点估计,主要有矩估计法和最大似然估计法 矩估计法是用样本矩去估计总体矩(或是用样矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;计方法,由此获得的估计量称作矩估计量; 最大似然估计法是把待估计的总体参数看作一最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数候这种概率最大,便把这个数值作为对总体参数的估计结果。

      的估计结果 n n(三)估计量的优良标准(三)估计量的优良标准2. 2. 有效性又称最小方差性又称最小方差性 n n(四)区间估计与估计的精度和可靠性(四)区间估计与估计的精度和可靠性 n n二、总体均值的估计 【【例例】】某企业加工的产品直径某企业加工的产品直径X X是一随是一随机变量,且服从方差为机变量,且服从方差为0.00250.0025的正态分的正态分布从某日生产的大量产品中随机抽取布从某日生产的大量产品中随机抽取6 6个,测得平均直径为个,测得平均直径为1616厘米,试在厘米,试在0.950.95的置信度下,求该产品直径的均值的置信度下,求该产品直径的均值置信区间置信区间 n n解:本例产品数量很多,即总体单位数N很大,故采用放回抽样的有关公式计算n n样本平均数 n =16n n样本平均的标准差 =0.0204n n抽样极限误差 =1.96×0.0204=0.04n n所求μ的置信区间为:n n16-0.04<μ<16+0.04 即(15.96,16.04) 如何得到? n n例:某零件的长度服从正态分布,从该批零件中随机抽取9件,测得平均长度为21.5mm,已知总体方差为0.0225.试求该种零件平均长度的95%的置信区间。

      n n解:已知解:已知n n则代入公式得:则代入公式得:n n即:即:n n 0.950.95n n n n 21.5 21.50.0250.025 n n我们用我们用95%95%的置信水平得到某班学生考试成绩的置信的置信水平得到某班学生考试成绩的置信区间为区间为60-8060-80分,如何理解?分,如何理解?n n错误的理解:错误的理解:60-8060-80区间以区间以95%95%的概率包含全班同学的概率包含全班同学平均成绩的真值;或以平均成绩的真值;或以95%95%的概率保证全班同学平均的概率保证全班同学平均成绩的真值落在成绩的真值落在60-8060-80分之间。

      分之间n n正确的理解:如果做了多次抽样(如正确的理解:如果做了多次抽样(如100100次),大概次),大概有有9595次找到的区间包含真值,有次找到的区间包含真值,有5 5次找到的区间不包次找到的区间不包括真值n n如果大家还是不能理解,那你们最好这样回答有关如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:区间估计的结果:n n该班同学平均成绩的置信区间是该班同学平均成绩的置信区间是60-8060-80分,置信度为分,置信度为95%95% n n(二)总体方差(二)总体方差σ σ2 2未知的情形未知的情形 2. 区间估计 n n【例】在上例中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间 n n例:在总体 服从正态分布的情况下,从某大学本科生中随机抽取100人,调查他们平均每天参加体育锻炼的时间为30分钟,样本方差为36,试以95%的置信水平估计该校本科生平均每天参加体育锻炼的时间? n n解;由题意可知,用T分布求解n n =95%,则n n其区间为:n n==n n== n n例:某种果树产量服从正态分布,随机抽取6 棵测得其产量分别为:111,91,102,104,116,110。

      以95%的置信水平估计全部果树的平均产量 n n解:n n代入公式计算得: n n=n n=(96.45,114.89) n n三、总体比例的估计三、总体比例的估计 n n解:本例总体单位数N很大,故采用放回抽样的有关公式计算n nn=300,p=0.02,n P=6≥5,可以认为户数n充分大,α=0.05,z=1.96n n△=0.0081*1.96=0.016n n因此,所求电视机拥有率的置信区间为n n0.02-0.016

      和合格品率进行区间估计 n n解:样本的平均耐用时数、方差和成数: n n平均耐用时数的区间为:平均耐用时数的区间为: n n成数的区间为:成数的区间为:问:问:这批灯泡合格品的数量的区间范围是多少?这批灯泡合格品的数量的区间范围是多少? 总体均值区间估计总结总体平均数估计区间的总体平均数估计区间的上下限上下限总体方差总体方差已知已知N(0,1)N(0,1)重复抽样重复抽样不重复抽样不重复抽样总体方差总体方差未知未知t(n-1)t(n-1)大样本时近大样本时近大样本时近大样本时近似服从似服从似服从似服从N(0,1)N(0,1)重复抽样重复抽样不重复抽样不重复抽样 如果不是正态总体,或分布未知总体方差已知总体方差已知且是大样本且是大样本总体方差未知总体方差未知且是大样本且是大样本 总体成数估计区间估计总结n n总体成数估计区间的上下限n n只考虑大样本情况(请记住大样本条件) n n一、问题的提出n n二、估计总体均值时样本容量的确定n n三、估计总体比例时样本容量的确定n n四、使用上述公式应注意的问题 参数估计中的精度要求与可靠性要求常常是一对矛盾! 增加样本容量n? 样本容量n究竟取多大合适?(一一)、问题的提出、问题的提出四、样本容量的确定 (二)、样本容量的确定 (三)、使用上述公式应注意的问题n n1.总体的方差与成数常常是未知的,这时可用有关资料替代:n n一是用历史资料已有的方差与成数代替;n n二是在进行正式抽样调查前进行几次试验性调查,用试验中方差的最大值代替总体方差;n n三是比例方差在完全缺乏资料的情况下,就用比例方差的最大可能值0.25代替。

      n n 2.上面的公式计算结果如果带小数,这时样本容量不按四舍五入法则取整数,取比这个数大的最小整数代替n n例如计算得到:n=56.03,那么,样本容量取57,而不是56 n n 3.如果进行一次抽样调查,需要同时估计总体均值与比例,可用上面的公式同时计算出两个样本容量,取其中较大的结果,同时满足两方面的需要 n n例:某公司为估计某市拥有其产品的家庭数目,进行了一次抽样调查,据销售部门估计该市拥有其产品的家庭约占10%1)若要求以95.45%的把握保证拥有率估计的绝对误差不超过1%,应抽多少户?(2)若其它条件不变,要求其产品拥有估计的相对误差不超过5%,又应抽多少? n n解:(1)已知:n n代入公式得: n n(2)已知:n n代入公式得: 第三节第三节 其它常用的抽样组织形式其它常用的抽样组织形式一、简单随机抽样一、简单随机抽样二、类型抽样二、类型抽样三、整群抽样三、整群抽样四、等距抽样四、等距抽样返回 一、一、 简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样) 按随机原则直接从总体按随机原则直接从总体N个单位中抽个单位中抽取取n个单位作为样本个单位作为样本应用应用适用于均匀总体适用于均匀总体 是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式返回 二、二、 类型抽样(分层抽样)类型抽样(分层抽样) 将总体全部单位分类按主要标志分类,将总体全部单位分类按主要标志分类,形成若干个类型组,然后从各类型中按随形成若干个类型组,然后从各类型中按随机原则分别抽取样本单位组成样本。

      机原则分别抽取样本单位组成样本总体总体N等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取样本样本n······ 能使样本结构更接近于总体结构,能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指提高样本的代表性;能同时推断总体指标和各子总体的指标标和各子总体的指标应用应用适用于总体单位标志适用于总体单位标志值大小悬殊的情况值大小悬殊的情况返回 三、三、 整群抽样(集团抽样)整群抽样(集团抽样) 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后,然后随机抽取一部分随机抽取一部分“群群”,被抽中群体的所有,被抽中群体的所有单位构成样本单位构成样本例:总体群数例:总体群数R=16 样本群数样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量样本容量返回 四、四、 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样) 将总体单位按某一标志排序,而将总体单位按某一标志排序,而后按一定顺序和间隔抽取样本单位后按一定顺序和间隔抽取样本单位······随机起点随机起点随机起点随机起点半距起点半距起点半距起点半距起点对称起点对称起点对称起点对称起点(总体单位按某一标志排序)(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样简单随机抽样简单随机抽样;;;;按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于类型抽样类型抽样类型抽样类型抽样。

      返回 第四节 假设检验n n一、什么是假设检验n n二、原假设与备择假设n n三、检验统计量n n四、显著性水平、P-值与临界值n n五、双侧检验和单侧检验n n六、假设检验的两类错误n n七、关于假设检验结论的理解 n n一、问题的提出n n【例】假定咖啡的分袋包装生产线的装袋重量服从正态分布N(μ,σ2)生产线按每袋净重150克的技术标准控制操作现从生产线抽取简单随机样本n=100袋,测得其平均重量为μ=149.8克,样本标准差s=0.872克问该生产线的装袋净重的期望值是否为150克(即问生产线是否处于控制状态)?第四节 假设检验 n n 所谓假设检验,就是事先对总体的参数或总体分布形式做出一个假设,然后利用抽取的样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否存在显著的系统性差异,所以假设检验又被称为显著性检验 一个完整的假设检验过程,包括以下几个步骤:n n(1)提出假设;n n(2)构造适当的检验统计量,并根据样本计算统计量的具体数值;n n(3)规定显著性水平,建立检验规则;n n(4)做出判断 n n2 2、原假设与备择假设、原假设与备择假设n n原假设原假设一般用一般用H H0 0表示,通常是设定总体参数等于某值,表示,通常是设定总体参数等于某值,或服从某个分布函数等或服从某个分布函数等n n备择假设备择假设是与原假设互相排斥的假设,原假设与备择是与原假设互相排斥的假设,原假设与备择假设不可能同时成立。

      假设不可能同时成立n n所谓假设检验问题实质上就是要判断所谓假设检验问题实质上就是要判断H H0 0是否正确,若是否正确,若拒绝原假设拒绝原假设H H0 0 ,则意味着接受备择假设,则意味着接受备择假设H H1 1 n n如在上例中,提出两个假设:假设平均袋装咖啡重量如在上例中,提出两个假设:假设平均袋装咖啡重量与所要控制的标准没有显著差异,与所要控制的标准没有显著差异, ;;n n假设平均袋装咖啡重量与所要控制的标准有显著差异,假设平均袋装咖啡重量与所要控制的标准有显著差异, n n3、检验统计量n n所谓检验统计量,就是根据所抽取的样本计算的用于检验原假设是否成立的随机变量n n检验统计量中应当含有所要检验的总体参数,以便在“总体参数等于某数值”的假定下研究样本统计量的观测结果n n检验统计量还应该在“H0成立”的前提下有已知的分布,从而便于计算出现某种特定的观测结果的概率 n n4、显著性水平、P-值与临界值n n1)、判断的依据:n n小概率原理:小概率事件在单独一次的试验中基本上不会发生,可以不予考虑。

      n n2)、判断的逻辑:n n如果在原假设正确的前提下,检验统计量的样本观测值的出现属于小概率事件,那么可以认为原假设不可信,从而否定它,转而接受备择假设 n n什么是小概率?这要根据实际问题而定n n假设检验中,通常取α=0.01,α=0.05 ,最大到α=0.10 n nα又称为显著性水平n n3)、判断规则:n n一是P-值规则;n n二是临界值规则 n n(1)P-值规则 所谓P-值,实际上是检验统计量超过(大于或小于)具体样本观测值的概率  单侧检验•若若p-p-值值 > >  , ,不拒绝不拒绝 H H0 0•若若p-p-值值 < <  , , 拒绝拒绝 H H0 0 双侧检验•若若p-p-值值 > >  /2/2, , 不拒绝不拒绝 H H0 0•若若p-p-值值 < <  /2/2, , 拒绝拒绝 H H0 0 n n【【例例】】上例的结果,计算其上例的结果,计算其P-P-值,并做出判断值,并做出判断 解:查标准正态概率表,解:查标准正态概率表, 当当z z=2.29=2.29时,时,(0.9774+0.9786)/2=0.9780(0.9774+0.9786)/2=0.9780,, 尾部面积为尾部面积为(1–0.9780)/2=0.011(1–0.9780)/2=0.011,, 由对称性可知,当由对称性可知,当z z= –2.29= –2.29时,左侧面积为时,左侧面积为0.0110.011。

      0.011≤α/2=0.0250.011≤α/2=0.025 0.011 0.011这个数字意味着,假若我们反复抽取这个数字意味着,假若我们反复抽取n n=100=100的样本,在的样本,在100100个样本中仅有可能出现一个个样本中仅有可能出现一个使检验统计量等于或小于使检验统计量等于或小于–2.29–2.29的样本该事件发的样本该事件发生的概率小于给定的显著性水平,所以,可以判断生的概率小于给定的显著性水平,所以,可以判断μ=150μ=150的假定是错误的,也就是说,根据观测的样的假定是错误的,也就是说,根据观测的样本,有理由表明总体均值与本,有理由表明总体均值与150150克的差异是显著存在克的差异是显著存在的 n n((2 2)临界值规则)临界值规则 假设检验中,根据所提出的显著性水平假设检验中,根据所提出的显著性水平标准(它是概率密度曲线的尾部面积)查表得到标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,称作临界值,相应的检验统计量的数值,称作临界值,   直接用检验统计量的观测值与临界值作比   直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;绝域)内,便拒绝原假设;   观测值落在临界值所划定的尾部之外(称   观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。

      的证据不足 n n注意:n n(1)P-值规则和临界值规则是等价的在做检验的时候,只用其中一个规则即可n n(2)P-值规则较之临界值规则具有更明显的优点第一,它更加简捷;第二,在P-值规则的检验结论中,对于犯第一类错误的概率的表述更加精确n n推荐使用P-值规则 n n【例】根上例的结果,用临界值规则做出判断   解:查表得到,临界值z0.025= –1.96由于 z= –2.29< –1.96,即,检验统计量的观测值落在临界值所划定的左侧(即落在拒绝域),因而拒绝μ=150克的原假设  上面的检验结果意味着,由样本数据得到的观测值的差异提醒我们:装袋生产线的生产过程已经偏离了控制状态,正在向装袋重量低于技术标准的状态倾斜 5、双侧检验和单侧检验 α/21–α α/2–Zα/2 Zα/2 α–Zα 0 α0 Zα (a)双侧检验(b)左侧检验 (c)右侧检验 拒绝域的单、双侧与备择假设之间的对应关系拒绝域的单、双侧与备择假设之间的对应关系拒拒拒拒绝绝域域域域位置位置位置位置P-P-值检验值检验的的的的显显著性水平著性水平著性水平著性水平判断判断判断判断标标准准准准原假原假原假原假设设备择备择假假假假设设双双双双侧侧α/2α/2HH0 0: :θ θ====θ θ0 0HH1 1: :θ θ≠≠θ θ0 0左左左左单侧单侧α αHH0 0: :θ θ≥≥θ θ0 0HH1 1: :θ θ<<θ θ0 0右右右右单侧单侧α αHH0 0: :θ θ≤≤θ θ0 0HH1 1: :θ θ>>θ θ0 0 6、假设检验的两类错误 n n例;某工厂准备购买一批较便宜的原材料,要例;某工厂准备购买一批较便宜的原材料,要是这批原材料的次品率大到是这批原材料的次品率大到5%5%以上,就拒绝以上,就拒绝购买。

      购买n n当假设检验后拒绝购买,就会犯第一类错误,当假设检验后拒绝购买,就会犯第一类错误,失去购买便宜原材料,而出高价购买,增加产失去购买便宜原材料,而出高价购买,增加产品成本;品成本;n n当假设检验后接受购买,就会犯第二类错误,当假设检验后接受购买,就会犯第二类错误,n n不合格原材料使产品的次品率上升不合格原材料使产品的次品率上升n n怎么办?工厂决策者有必要搞清楚哪一类错误怎么办?工厂决策者有必要搞清楚哪一类错误造成的损失小,以减少成本造成的损失小,以减少成本 7、关于假设检验结论的理解n n在假设检验中,当原假设被拒绝时,我们能够以较大的把握肯定备择假设的成立而当原假设未被拒绝时,我们并不能认为原假设确实成立 二、单个总体均值的检验 n n例:某车间生产一种机器零件,已知其直径平均长度为32.05,方差为1.21现进行工艺改革,如果质量不下降,可以进行全面改革,如果质量下降则暂不改革现随机抽取6个零件,测得其直径为:32.56,29.66,31.64,30.00,31.87,31.03试以95%的显著水平检验该改革是否可以实行? n n解:解:假设为:假设为:临界值:临界值:接受域:接受域:否定域:否定域:Z>1.96Z>1.96或或Z<-1.96Z<-1.96检验统计量:检验统计量:判断:判断:Z Z值落在否定域内,故拒绝值落在否定域内,故拒绝H0H0。

      表明工艺改表明工艺改革前后,零件的平均直径有显著的差别,对生产影革前后,零件的平均直径有显著的差别,对生产影响是显著响是显著该改革是不可以实行该改革是不可以实行 n n例:已知总体服从例:已知总体服从N N((9090,, 50502 2 )从该总体中随机抽取容量为该总体中随机抽取容量为2525的样本,得的样本,得出样本平均值为出样本平均值为7070试以95%95%的显著水的显著水平检验原假设平检验原假设 n n解:解:n n结论:否定原假设结论:否定原假设 n n例:某厂生产一种产品,原月产量服从N(75,14)设备更新后,为了考察产量是否提高,抽查了六个月产量,得到平均月产量为78问在显著水平95%下,设备更新后月产量是否有显著的提高? n n解:解:为什么是为什么是单侧检验?单侧检验?结论:否定原假设,说明设备更新后,月产量有所提结论:否定原假设,说明设备更新后,月产量有所提高 n n例:已知某种汽油用二某种型号的汽车,每公升油可行驶18公里现研制出一种添加剂以后,每公升汽油行驶的里程是否有变化?现随机抽取25辆汽车作试验,结果平均行驶里程为18.5公里,方差为2.2。

      试作出检验 n n解:解:n n结论:接受原假设,有结论:接受原假设,有95%95%把握预言加入添把握预言加入添加剂后每公升汽油行驶的里程无显著变化加剂后每公升汽油行驶的里程无显著变化双侧 三、单个总体比例的假设检验 n n【例】一项调查结果声称,某市小学生每月零花钱达到200元的比例为40%,某科研机构为了检验这个调查是否可靠,随机抽选了100名小学生,发现有47人每月零花钱达到200元,调查结果能否证实早先调查40%的看法? n n例:某工厂领导认为超过35%的工人满意该厂的工作环境为了证实该结论,有关部门作了一次调查,随机抽取了150名工人,其中有69人对工作环境满意试以95%的显著水平检验 的假设 n n解:假设:n n临界值:n n接受域:n n检验统计量的值: n n结论:结论:Z Z值落在拒绝域内,故拒绝原假设,值落在拒绝域内,故拒绝原假设,接受备择假设,说明该厂工人对工作环境的接受备择假设,说明该厂工人对工作环境的满意程度确实超过了满意程度确实超过了35%35%例:某公司推出一种男女均宜的饮料,例:某公司推出一种男女均宜的饮料,认为这种饮料的消费者性别比例各为认为这种饮料的消费者性别比例各为50%50%。

      对消费者抽样调查结果表明:对消费者抽样调查结果表明:100100名接受调查的消费者中,男性饮用名接受调查的消费者中,男性饮用者者5555人,女性有人,女性有4545人当 时,问该饮料消费者的性别比例相等时,问该饮料消费者的性别比例相等的看法是否成立?的看法是否成立? 解:接受域:(-1.96,1.96)P=0.5,则:结论:Z值落在拒绝域内,故拒绝原假设,接受备择假设,说明该饮料消费者的性别比例相等的看法是成立的当然用女性资料也可得出相同结论) 第五节 单因子方差分析n n一、问题的提出n n二、方差分析的检验统计量n n三、关于方差分析的两点说明One-Factor ANOVA 一、问题的提出n n【【例例】】已知在一组给定的条件下饲养小鸡所增加的体重服从正态分布已知在一组给定的条件下饲养小鸡所增加的体重服从正态分布某养鸡场欲检验四种饲料配方对小鸡增重的影响是否不相同(假定已某养鸡场欲检验四种饲料配方对小鸡增重的影响是否不相同(假定已经经过检验表明不同饲料配方下的小鸡增重方差相等)为此,他们经经过检验表明不同饲料配方下的小鸡增重方差相等)。

      为此,他们对四组初始条件完全相同的小鸡,在完全相同的其他饲养条件下,分对四组初始条件完全相同的小鸡,在完全相同的其他饲养条件下,分别使用四种不同的饲料配方进行喂养所得到的增重数据如表所示别使用四种不同的饲料配方进行喂养所得到的增重数据如表所示 四种不同饲料配方下小鸡的增重情况四种不同饲料配方下小鸡的增重情况饲料配方饲料配方 i i小鸡序号小鸡序号 j j3838周后小鸡个体增重周后小鸡个体增重y yij ij( (克克) ) 1 12 23 34 45 56 6配方配方配方配方1 137037042042045045049049017301730配方配方配方配方2 249049038038040040039039050050041041025702570配方配方配方配方3 333033034034040040038038047047019201920配方配方配方配方4 441041048048040040042042038038041041025002500160016001620162016501650168016801350135082082087208720 n n对于类似本例的问题,一般地,把随机变量分组的数目记作m,我们可建立下列假设: 方差分析Analysis of Variance ((ANOVA ) 因素也称为因素也称为处理处理因素(因素(因素(因素(factorfactor)(名义分类变量))(名义分类变量))(名义分类变量))(名义分类变量),每,每一处理因素至少有两个一处理因素至少有两个水平水平(level)(也称(也称“处理组处理组”)。

      一个一个因素因素((水平水平间独立)间独立) ——单因素方差分析单因素方差分析 两个两个因素因素((水平水平间独立或相关)间独立或相关)——双因素方差分析双因素方差分析 一个个体多个测量值一个个体多个测量值——可可重复测量资料的方差分析重复测量资料的方差分析 ANOVA与回归分析相结合与回归分析相结合——协方差分析协方差分析 目的:目的:用这类资料的样本信息来推断各处理组间用这类资料的样本信息来推断各处理组间多个总多个总体均数体均数的差别有无统计学意义的差别有无统计学意义 ANOVA ANOVA 由英国统计由英国统计学家学家R.A.FisherR.A.Fisher首创,首创,为纪念为纪念FisherFisher,以,以F F命命名,故方差分析又称名,故方差分析又称 F F 检验检验 ((F F test test)用于推断于推断多个总体均数多个总体均数有有无差异无差异 组间变异组间变异总变异总变异组内变异组内变异二、方差分析的检验统计量所有测量值之间所有测量值之间总的变异程度总的变异程度各组均数与总均数各组均数与总均数的离均差平方和的离均差平方和用各组内各测量用各组内各测量值值Yij与其所在与其所在组的均数差值的组的均数差值的平方和来表示平方和来表示 (mean square,,MS) 【例例】利用上表中的数据进行单因子方差分析(显著水平为α=0.05)。

      方差分析表方差分析表变变异异异异来源来源来源来源离差离差离差离差平方和平方和平方和平方和自由自由自由自由度度度度均方差均方差均方差均方差值值P-P-值值临临界界界界值值组间组间7112.1437112.1432370.7142370.7141.012321.012320.411570.411573.196773.19677组组内内内内39811.6739811.6717172341.8632341.863总计总计46923.8146923.812020 n n(一)方差分析中变量的类型(一)方差分析中变量的类型 方差分析中的因变量是数量型变量自变量方差分析中的因变量是数量型变量自变量可以是品质型变量,也可以是数量型变量当自变可以是品质型变量,也可以是数量型变量当自变量是数量型变量的时候,也要对其作统计分组设计,量是数量型变量的时候,也要对其作统计分组设计,也就是将它按品质型变量来处理也就是将它按品质型变量来处理 (二)总体的正态性和同方差(二)总体的正态性和同方差n n 方差分析适用于多个正态总体方差分析适用于多个正态总体Y Yi i((i=1i=1,,2 2,,……,,mm)均值的比较,且要求它们具有相同的方差。

      均值的比较,且要求它们具有相同的方差不过在实际应用中,即使对于正态性和同方差性都不过在实际应用中,即使对于正态性和同方差性都存在很大背离的数据,方差分析仍不失为一种提供存在很大背离的数据,方差分析仍不失为一种提供有用的近似信息的技术有用的近似信息的技术 三、关于方差分析的两点说明三、关于方差分析的两点说明 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.