
统原PP第七章抽样估计(上).ppt
15页第七章 抽样估计•科学有险阻•苦战能过关 • 陈 毅1第七章 抽样估计笫一节 抽样估计的意义和作用• 一、抽样估计的基本概念• 1、全及总体和样本总体•全及总体 被调查研究的事物的全体,母体•样本总体 从全及总体中随机抽取的部分,样本•总体单位 总体单位数 总体总量 N 有限 无限 特大•样本单位 样本单位数 样本容量 n 有限•大样本 n≥50 n≥30(精度不高,方差小)方法易 社会经济统计•小样本 n<50 n<30 (非正态,为t分布) 方法难 自然技术统计• ★从全及总体中,可抽一个样本,也可抽一系列样本,每个样本都可以计算各种指标2 2、全及指标和样本指标全及指标 根据全及总体单位计算的统计指标 P σσ2常数未知样本指标 根据抽样总体单位计算的统计指标 P s s2变数计算 3、重置抽样和不重置抽样重置抽样 被抽中单位仍放回总体参加下次抽取。
不重置抽样 被抽中单位不放回总体不参加下次抽取 4、全部可能样本数不重置抽样考虑顺序 不重复排列数重置抽样考虑顺序 可重复排列数不重置抽样不考虑顺序 不重复组合数重置抽样不考虑顺序 可重复组合数 ※ N n固定,则所有可能样本数固定◎考虑顺序所有可能样本数>不考虑顺序所有可能样本数#重置抽样所有可能样本数>不重置抽样所有可能样本数3 4、抽样误差 统计误差 登记性误差(登记或计算) (统计值与实际值之差)代表性误差 系统性误差(偏差 违反随机原则) (非全面调查) 随机误差 实际误差(某一样本) (不同样本带来) 平均误差(全部样本) 抽样平均误差(抽样误差):由于抽样的随机性而产生的,样本指标与总体指标之间的平均误差,是所有可能出现的样本指标的标准差 5、置信区间和置信概率置信区间:估计的总体指标所在的范围置信概率:置信区间的可靠性大小 二、抽样估计的意义 抽样估计——按照随机原则,从全及总体中抽取部分单位组成样本,对样本进行调查并计算出各种统计指标,以此对全及指标所在范围进行概率估计的统计方法。
4三、抽样估计的作用 1、用于无限总体或特大总体 如环境污染 、大气测量 、 含水率等 2、用于破坏性试验 3、用于其它特殊总体 没必要或不可能全面调查的总体 4、验证和修正全面调查的结果 如人口普查5 第二节 抽样估计的理论基础 对概率论与数理统计知识的简单回顾 一、正态分布 1、密度函数数学期望 决定正态分布曲线的位置标准差σ 决定正态曲线的形状,当σ值变小时,中心分布升高,正态曲线趋于集中;当σ值变大时,中心分布降低,正态曲线趋于平缓 2、标准正态分布 μ=0 σ=1的正态分布t=1 γ=68.27%t=2 γ=95.45%t=3 γ=99.73%t=1.96 γ=95%t=2.58 γ=99% 3、标准化 变量代换6 二、样本的分布 1、样本的代表性 ①分布越接近于总体的样本代表性越强,然而有些接近,有些不接近 ②总希望接近总体的样本数量多一些,抽到它们的概率高一些。
③样本平均数是样本的代表值,研究它的分布规律是研究样本代表性问题的关践①总 体 的 分 布 单位数N 分布未知 均数 标准差σ②样 本 的 分 布 单位数n 不太偏 均数 标准差s③样本均数分布 单位数 正态分布 均数 标准差 2、大数定理:只要n充分大,样本的分布一致于总体的分布,样本均数趋近于总体均数,样本标准差趋近于总体标准差73、中心极限定理•(1)若总体为正态分布,样本均数 也服从正态分布•(2)总体为任意分布(不太偏),样本均数 随着n的增大而趋近于正态分布n≥50)•(3)样本平均数的平均数等于总体平均数 =•(4)样本平均数的标准差为:•重置抽样•不重置抽样8第三节 总体平均数的抽样估计• 一、总体均数估计的公式• 中心极限定理表明,只要n足够大(n>50),样本均数的分布就趋近于正态分布 ,作变量代换•则z服从于标准正态分布:9• 二、区间估计的特点• 第一、抽样估计计算的是总体指标所在的范围称为置信区间。
•不等式表示:•区间表示:•定值表示:• 第二、置信区间表明的是一个可能范围,不是可靠范围,总体落在置信区间内的概率称为置信概率用γ表示• 第三、扩大置信区间可提高置信概率,缩小置信区间可降低置信概率,扩大或缩小的倍数称为概率度,用t表示• 称为极限抽样误差,是抽样误差的最大限度•例如:若概率度t=2 ,则极限误差为 ,置信区间为• ,置信概率为95.45%10• 三、抽样误差的计算• 以上公式中, 的计算是抽样估计的基础,称为抽样平均误差,简称抽样误差,用 表示理论上:• 数理统计证明,样本标准差 s 是总体标准差 σ 的偏误估•计量,而 是总体标准差σ的无偏估计量• 当n>>1时,n-1≈n, ,可用样本标准差 s 代替总体标准差σ计算。
• 抽样误差的计算公式:•重置抽样:•不重置抽样: 11四、大样本平均数抽样估计综述• 重置抽样• 不重置抽样• 估计步骤:•1、据样本资料计算 和s•2、根据置信概率γ确定t(正态分布表)•3、计算抽样误差(重置或不重置)•4、计算极限抽样误差•5、计算置信区间•6、回答12大样本平均数抽样估计举例•对某灯泡厂随机抽取500个灯泡•进行质量检验,结果如右表所示•求该厂全部灯泡平均耐用时间的•取值范围(置信概率为.9973)•解:灯泡平均耐用时间•样本标准差•∵γ=99.73% ∴t=3•抽样误差•极限抽样误差•置信区间耐用时间(小时)灯泡数800—85035850—900127900—950185950—10001031000—1050421050—1100813课堂练习•某地居民1000人,其年收入抽样调查•结果如右表所示•以95%的置信概率估计该地人口年均收入•解:①人口年均收入•样本标准差•∵γ=95% ∴t=1.96•抽样误差•极限抽样误差•置信区间年收入分组(元)人口数600以下50600-800200800-10004001000-12002001200以上15014课外作业•某地有小麦10000亩,抽样调查•结果如右表所示。
•① 以95%的置信概率估计小麦•亩产量所在范围•② 以68.27%的置信概率估计•亩产量在300kg以上的播种面积数亩产量分组(kg)亩数(亩)200以下10200-25022250-30030300-35025350以上1315。












