第八章ppt课件.ppt
40页第八章参数估计statisticsstatistics统计学统计学————第八章参数估计第八章参数估计第一节第一节 参数估计的一般问题参数估计的一般问题第二节第二节 单总体参数的区间估计单总体参数的区间估计第三节第三节 样本容量的确定样本容量的确定本章内容本章内容statisticsstatistics统计学统计学————第八章参数估计第八章参数估计第一节参数估计的一般问题statisticsstatistics统计学统计学————第八章参数估计第八章参数估计参数估计在统计方法中的地位statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 一、抽样推断一、抽样推断 ㈠抽样推断的概念㈠抽样推断的概念:按照随机性原则,从研究对象中抽取按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数据,对研究对象一部分进行观察,并根据所得到的观察数据,对研究对象的数量特征做出具有一定可靠程度的估计和推断,以达到的数量特征做出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法认识总体的一种统计方法 ㈡抽样推断的特点:㈡抽样推断的特点: 1.样本资料对总体的数量特征作出具有一定可靠性;样本资料对总体的数量特征作出具有一定可靠性; 2.按照随机性原则从全部总体中抽取样本单位;按照随机性原则从全部总体中抽取样本单位; 3.抽样推断必然会产生抽样误差。
抽样推断必然会产生抽样误差 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 二、参数估计的一般问题二、参数估计的一般问题 (一)参数估计((一)参数估计(parameter estimation)的概念::就是用样本统)的概念::就是用样本统计量去估计总体的参数计量去估计总体的参数1.估计量:用于估计总体参数的随机变量估计量:用于估计总体参数的随机变量•如样本均值,样本比例、样本方差等如样本均值,样本比例、样本方差等•例如例如: 样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量2.参数用参数用 表示,估计量表示,估计量用用 表示表示3.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值•如果样本均值如果样本均值 x =5600,则,则5600就是就是的估计值的估计值 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 表表8-2 样本统计量和总体参数符号对应关系样本统计量和总体参数符号对应关系statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 (二)点估计与区间估计(二)点估计与区间估计 1.点估计:根据样本统计量直接估计出总体参点估计:根据样本统计量直接估计出总体参数数θ的值,称为参数的点估计。
常用的方法有两种:的值,称为参数的点估计常用的方法有两种:矩估计法和极大似然估计法矩估计法和极大似然估计法 2.区间估计:在点估计的基础上,给出总体参区间估计:在点估计的基础上,给出总体参数估计的一个范围图数估计的一个范围图8-1给出了区间估计的示意给出了区间估计的示意图:图: statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 图图8-1 区间估计的图示区间估计的图示statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 3. 在区间估计中,由样本统计量所构造的总体在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限小值称为置信下限,最大值称为置信上限 4.置信水平:如果将构造置信区间的步骤重复置信水平:如果将构造置信区间的步骤重复多次,置信区间包含总体参数真值的次数所占的多次,置信区间包含总体参数真值的次数所占的比率 5.比较常用的置信水平及正态分布曲线下的右比较常用的置信水平及正态分布曲线下的右侧面积为时的值(即临界值侧面积为时的值(即临界值Zα/2)。
statisticsstatistics统计学统计学————第八章参数估计第八章参数估计表表8-3 8-3 常用置信水平的值常用置信水平的值statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 图图8-3 8-3 重复构造出置信水平重复构造出置信水平95%95%,, 的的2020个个置信区间置信区间 点估计点估计值值statisticsstatistics统计学统计学————第八章参数估计第八章参数估计三、评估估计量的标准三、评估估计量的标准无无 偏偏 性性 :: 估估 计计 量量 抽抽 样样 分分 布布 的的 数数 学学 期期 望望 等等 于于 被被 估计的总体参数估计的总体参数P P( ( ) )B BA A无偏无偏无偏无偏有偏有偏有偏有偏图图8-48-4statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 一一 致致 性性 :: 随随 着着 样样 本本 容容 量量 的的 增增 大大 ,, 估估 计计 量量 的的 值越来越接近被估计的总体参数值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较大的样本容量较大的样本容量P P( ( ) )图图8-58-5statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 有有 效效 性性 :: 对对 同同 一一 总总 体体 参参 数数 的的 两两 个个 无无 偏偏 点点 估估 计计 量,有更小标准差的估计量更有效量,有更小标准差的估计量更有效. AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P( ( ) )图图 8-68-6statisticsstatistics统计学统计学————第八章参数估计第八章参数估计第二节单总体参数的区间估计statisticsstatistics统计学统计学————第八章参数估计第八章参数估计一、总体均值的区间估计(一)大样本的估计方法(一)大样本的估计方法 1.样本均值经过标准化以后的随机变量则服从正态分布,样本均值经过标准化以后的随机变量则服从正态分布,即即 2.总体均值总体均值 所在(所在(1-α)置信水平下的置信区间为:)置信水平下的置信区间为: ((8.2))((8.1))称为置信下限,称为置信下限, 称为置信上限。
称为置信上限 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例例1 1.一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企.一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求现从某天生产业质检部门经常要进行抽检,以分析每袋重量是否符合要求现从某天生产的一批食品中随机抽取了的一批食品中随机抽取了2525袋,测得每袋重量(单位:袋,测得每袋重量(单位:g g)如下表所示已)如下表所示已知产品重量的分布服从正态分布,且总体标准差为知产品重量的分布服从正态分布,且总体标准差为10g10g试估计该批产品平试估计该批产品平均重量的置信区间,置信水平为均重量的置信区间,置信水平为95%95%表表8-3 258-3 25袋食品的重量袋食品的重量 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计即:该批食品平均重量即:该批食品平均重量95%95%的置信区间为的置信区间为101.44g101.44g~~109.28g109.28gstatisticsstatistics统计学统计学————第八章参数估计第八章参数估计利用Excel来计算置信区间 •1.1.将样本数据输入将样本数据输入ExcelExcel工作表中工作表中A1:E5A1:E5 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 •2.2.计算样本均值。
点击粘贴函数计算样本均值点击粘贴函数““fxfx””,选择,选择““统计统计””下的下的““AVERAGE”AVERAGE”函数在出现的在出现的““函数参数函数参数””对话框中,对话框中,““Number1”Number1”一栏填入样本数据所在区域一栏填入样本数据所在区域A1:E5A1:E5,然后,然后““确定确定””,在输出区域内(本例放置在,在输出区域内(本例放置在F1F1)得结果)得结果105.36105.36,此即,此即样本均值样本均值 statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 •3.计算样本标准差计算样本标准差,选择的函数为选择的函数为“统计统计”下的下的“STDEV”函数本例函数本例放在放在G1,得结果得结果9.6545.statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 •4.计算允许误差选择计算允许误差选择“统计统计”下的下的“CONFIDENCE”函数,在出现的函数,在出现的“函数函数参数参数”对话框中,对话框中,“Alpha”一栏填入显著性水平一栏填入显著性水平“0.05”,,“Standard_dev”一栏填入总体标准差一栏填入总体标准差“G1”(大样本情况下,可用样本标(大样本情况下,可用样本标准差代替),准差代替),“Size”一栏填入样本容量一栏填入样本容量“25”,然后,然后“确定确定”,在输出区,在输出区域内得允许误差域内得允许误差“3.784490”(取近似值(取近似值3.78)。
statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 •5.置信下限为置信下限为105.36--3.78==101.58,置信上限为,置信上限为105.36++3.78==109.14,,即置信区间为(即置信区间为(101.58,,109.14))g statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 (二)小样本的估计方法(二)小样本的估计方法 总体方差总体方差σ2未知,而且是在小样本的情况下,未知,而且是在小样本的情况下,则需要用样本方差则需要用样本方差S2代替代替σ2,这时样本均值经过标,这时样本均值经过标准化以后的随机变量则服从自由度为(准化以后的随机变量则服从自由度为(n-1)的)的t分分布,即:布,即:(8.4)statisticsstatistics统计学统计学————第八章参数估计第八章参数估计t 分布是类似正态分布的一种对称分布,它通常要比正分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散一个特定的分布依赖于称之为自由度的态分布平坦和分散一个特定的分布依赖于称之为自由度的参数。
随着自由度的增大,分布也逐渐趋于正态分布参数随着自由度的增大,分布也逐渐趋于正态分布 ,如,如图图8--7和图和图8--8所示:所示: 图图8 8--7 7 图图8 8--8 8statisticsstatistics统计学统计学————第八章参数估计第八章参数估计 •总体均值总体均值 在在1- 置信水平下的置信区间为:置信水平下的置信区间为:(8.5)式中:是自由度为式中:是自由度为n-1n-1时,时,t t分布中上侧面积为分布中上侧面积为α/2α/2时的临时的临界值,该值可通过界值,该值可通过t t分布表查得分布表查得statisticsstatistics统计学统计学————第八章参数估计第八章参数估计利用利用Excel中的中的TINV统计函数统计函数 计算计算t分布临界值分布临界值•t分布临界值可通过分布临界值可通过Excel中的中的TINV统计函数来计算点击粘贴函数统计函数来计算点击粘贴函数“fx”,选择,选择“统计统计”下的下的“TINV”函数在对话框中,函数。
在对话框中,“Probability”一栏填入显著性水平(本例为一栏填入显著性水平(本例为0.05),),“Deg_freedom”填入自由度(本例为填入自由度(本例为15),然后),然后“确定确定”得结果“2.13145”,此即,此即t分布的临界值分布的临界值statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取例.已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取1616只,测得其只,测得其使用寿命使用寿命( (单位:单位:h)h)如表如表8 8--5 5建立该批灯泡平均使用寿命建立该批灯泡平均使用寿命95%95%的置信区间的置信区间表表8 8--5 165 16只灯泡使用寿命数据只灯泡使用寿命数据解:根据样本数据,计算样本均值解:根据样本数据,计算样本均值=1490h=1490h,样本方差,样本方差S=24.77hS=24.77h根据根据α=0.05α=0.05查查t t分布表得(分布表得(n-1n-1))=t=t0.025 0.025 (15)=2.131(15)=2.131于是,平均使用寿命的置信区间为:于是,平均使用寿命的置信区间为:即全部灯泡的平均使用寿命,在置即全部灯泡的平均使用寿命,在置信水平信水平1 1--αα==0.950.95下的置信区间为下的置信区间为((1476.81476.8,,1503.21503.2))h h。
statisticsstatistics统计学统计学————第八章参数估计第八章参数估计总结:表表8 8--6 6 总体均值的区间估计总体均值的区间估计statisticsstatistics统计学统计学————第八章参数估计第八章参数估计二、总体比例的区间估计1. 样本比例经标准化后的随机变量则服从正态分布,即:(8.6)2. 总体比例在1-置信水平下的置信区间为: (8.7)式中:式中:1-α1-α称为置信水平;称为置信水平; 是标准正态分布上侧面积为是标准正态分布上侧面积为α/2α/2时的临界值;时的临界值; 是估计总体比例时的允许误差是估计总体比例时的允许误差statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例.为了解某城市家庭电脑的普及情况,随机抽取了例.为了解某城市家庭电脑的普及情况,随机抽取了100100户家庭,其中有户家庭,其中有6060户户有电脑试以有电脑试以9595%的置信水平估计该城市家庭中拥有电脑比例的置信区间%的置信水平估计该城市家庭中拥有电脑比例的置信区间。
解:已知解:已知 n n==100100,,n n1 1==60 , 60 , 则样本比例为:则样本比例为:p p==6060%%由于由于1 1-- = 95%= 95%,查标准正态分布表可知,,查标准正态分布表可知,Z Zα/2α/2=1.96=1.96于是于是即即该该城城市市家家庭庭中中,,拥拥有有电电脑脑的的比比例例在在置置信信水水平平9595%%下下的的置置信信区区间间为为::((50.39650.396%,%,69.60469.604%)statisticsstatistics统计学统计学————第八章参数估计第八章参数估计三、总体方差的区间估计总体方差在(总体方差在(1-α1-α)置信水平下的置)置信水平下的置信区间为:信区间为:statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例.一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机例.一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了抽取了2525袋,测得每袋重量如下表所示已知产品重量的分布服从正态分布袋,测得每袋重量如下表所示已知产品重量的分布服从正态分布。
以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间表表8 8--7 257 25袋食品重量袋食品重量statisticsstatistics统计学统计学————第八章参数估计第八章参数估计解:根据样本数据计算样本方差:解:根据样本数据计算样本方差:S S2 2 =93.21 =93.21;;已知已知n n==2525,,1-1- ==95% ,95% ,查查χχ2 2分布表可得临界值为:分布表可得临界值为: 总体方差总体方差 2 2置信水平为置信水平为95%95%的置信区间为的置信区间为 :: 即:总体方差的置信区间为(即:总体方差的置信区间为(56.8356.83,,180.39180.39) 相应地,企业生产的食品总体重量标准差的的置信区间为相应地,企业生产的食品总体重量标准差的的置信区间为7.54g7.54g~~13.43g13.43g。
statisticsstatistics统计学统计学————第八章参数估计第八章参数估计第三节样本容量的确定statisticsstatistics统计学统计学————第八章参数估计第八章参数估计一、估计总体均值时样本容量的确定 一一旦旦确确定定了了置置信信水水平平((1-α1-α)),, 的的值值就就确确定定了了,,对对于于给给定定的的的的值值和和总总体体标标准准差差σσ,,就就可可以以确确定定任任一一希希望望的的允允许许误误差所需要的样本容量令差所需要的样本容量令E E代表所希望达到的允许误差,即:代表所希望达到的允许误差,即:由此可以推到出确定样本容量的公式如下:由此可以推到出确定样本容量的公式如下:(8.8)(8.9)statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例例.拥有.拥有MBAMBA学位的研究生年薪的标准差大约为学位的研究生年薪的标准差大约为40004000元,假元,假定想要估计年薪定想要估计年薪95%95%的置信区间,希望允许误差为的置信区间,希望允许误差为1000010000元,元,应抽取多大的样本容量?应抽取多大的样本容量?解解::已已知知 =4000=4000,,E E==1000, 1000, 1 1-- =95%=95%,, Z Zα/2α/2==1.961.96,所以,应抽取的样本容量为:,所以,应抽取的样本容量为: 即应抽取即应抽取6262人作为样本。
人作为样本statisticsstatistics统计学统计学————第八章参数估计第八章参数估计二、估计总体比例时样本容量的确定• 一旦确定了置信水平(一旦确定了置信水平(1-α1-α),), 的值就确定了由于总体比例的值是固的值就确定了由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小估计定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小估计的精度就越好因此,对于给定的的的精度就越好因此,对于给定的的 值,就可以确定任一希望的允许误差所值,就可以确定任一希望的允许误差所需要的样本容量令需要的样本容量令E E代表所希望达到的允许误差,即:代表所希望达到的允许误差,即: 由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下:由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下: (8.10)(8.11)statisticsstatistics统计学统计学————第八章参数估计第八章参数估计例例1010.某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范.某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在围设定在5 5%,问如果以%,问如果以9595%的置信水平进行参数估计,需要多大的样本?%的置信水平进行参数估计,需要多大的样本?解:由于解:由于1-α=0.951-α=0.95,,α=0.05α=0.05,, =1.96=1.96。
因因为为ππ的的值值不不知知道道,,取取使使ππ((1 1--ππ))最最大大值值的的0.50.5,,即即ππ取取0.50.5,于是:,于是: 故需取故需取385385人的样本人的样本。





