
抽样分布与参数估计.ppt
71页第五章第五章 抽样分布与参数估计抽样分布与参数估计本章主要内容本章主要内容n抽样调查概述抽样调查概述n抽样推断的原理抽样推断的原理n必要样本容量的确定必要样本容量的确定第一节第一节 抽样调查概述抽样调查概述 n抽样调查的含义抽样调查的含义n抽样调查的分类抽样调查的分类n抽样调查的特点抽样调查的特点n抽样调查的应用抽样调查的应用n样本单位的抽选方法样本单位的抽选方法n抽样调查的组织方式抽样调查的组织方式n抽样调查中的几个基本概念抽样调查中的几个基本概念n抽样推断中的理论依据抽样推断中的理论依据返回一、抽样调查的含义一、抽样调查的含义 按照一定的程序 按照一定的程序, ,从所研究对象的全体从所研究对象的全体(总体)(总体)中抽取一部分单位中抽取一部分单位(样本)(样本)进行调进行调查,根据样本资料的估计值,对总体待估参查,根据样本资料的估计值,对总体待估参数作出具有一定可靠程度的估计和推断,以数作出具有一定可靠程度的估计和推断,以反映总体的数量特征或数量表现反映总体的数量特征或数量表现抽抽样调查:抽:抽样分布的形成分布的形成过程程总体总体总体总体计算样本统计量计算样本统计量如:样本均值、如:样本均值、比例、方差比例、方差样样样样本本本本三种不同性质的分布三种不同性质的分布n总体分布总体分布n样本分布样本分布n抽样分布抽样分布返回n总体中各元素的观察值所形成的分布总体中各元素的观察值所形成的分布 n分布通常是未知的分布通常是未知的n可以假定它服从某种分布可以假定它服从某种分布 总体分布(体分布(Population Distribution))总体总体总体总体返回n一个一个样本中各本中各观察察值的分布的分布 n也称也称经验分布分布 n当当样本容量本容量n逐逐渐增大增大时,,样本分布逐本分布逐渐接近接近总体的分布体的分布 样本分布(本分布(Sample Distribution))样样样样本本本本返回n样本本统计量的概率分布,是一种理量的概率分布,是一种理论分布分布u在重复在重复在重复在重复选选取容量取容量取容量取容量为为n n的的的的样样本本本本时时,由,由,由,由该统计该统计量量量量的所有可能取的所有可能取的所有可能取的所有可能取值值形成的相形成的相形成的相形成的相对频对频数分布数分布数分布数分布 n随机随机变量是量是 样本本统计量量u样样本均本均本均本均值值,,,,样样本比例,本比例,本比例,本比例,样样本方差等本方差等本方差等本方差等n结果来自果来自容量相同容量相同的的所有所有可能可能样本;本;n提供了提供了样本本统计量量长远而而稳定的信息,是定的信息,是进行推断的理行推断的理论基基础,也是抽,也是抽样推断科学推断科学性的重要依据性的重要依据 。
抽抽样分布(分布(Sampling Distribution))返回二、抽样调查的分类二、抽样调查的分类n随机抽随机抽样::按照按照随机原随机原则,完全排除了人,完全排除了人为的主的主观因素,因素,总体中每个体中每个单位都有一定的概位都有一定的概率被率被选入入样本n非随机抽非随机抽样::从方便出从方便出发或者根据研究者主或者根据研究者主观的判断来抽取的判断来抽取样本,不遵循随机原本,不遵循随机原则无法估法估计和控制抽和控制抽样误差,无法用差,无法用样本的数量本的数量特征来推断特征来推断总体本章主要本章主要讨论随机抽随机抽样的原理和方法的原理和方法返回三、抽样调查的特点三、抽样调查的特点n 随机原则随机原则 所谓随机原则,则完全排除主观意识所谓随机原则,则完全排除主观意识的作用,而在被研究的总体中随机抽取调的作用,而在被研究的总体中随机抽取调查单位,使每个单位都有同等被抽中的机查单位,使每个单位都有同等被抽中的机会,抽中与否,完全是偶然机会的结果会,抽中与否,完全是偶然机会的结果这个原则也叫这个原则也叫同等可能性原则同等可能性原则n从数量上推断总体从数量上推断总体 抽样调查的主要任务是通过对部分单位抽样调查的主要任务是通过对部分单位的调查,计算出抽样指标,进而推断总体指的调查,计算出抽样指标,进而推断总体指标,确定总体的数量特征。
标,确定总体的数量特征n抽样误差的范围,可以事先计算并控制抽样误差的范围,可以事先计算并控制 保证抽样推断的结果达到事先预定的可保证抽样推断的结果达到事先预定的可靠程度返回四、抽样调查的应用四、抽样调查的应用抽样调查具有节省人力、物力、财力和时间等抽样调查具有节省人力、物力、财力和时间等优点,适用于以下几种情况:优点,适用于以下几种情况:n对某些某些现象不可能或不必要象不可能或不必要进行全面行全面调查,,而又要了解而又要了解现象象总体数量特征体数量特征时采用抽采用抽样调查方法;方法;n应用抽用抽样调查,可以,可以检查全面全面调查资料的料的质量,并量,并对全面全面调查资料料进行修行修订;;n可用于生可用于生产管理,管理,进行行产品品质量控制返回五、样本单位的抽选方法五、样本单位的抽选方法——重复抽样和不重复抽样重复抽样和不重复抽样n重复抽重复抽样,,也叫也叫回置抽回置抽样 ,,指从指从总体的体的N个个单位中抽取一个容量位中抽取一个容量为n的的样本,每次抽出本,每次抽出一个一个单位后,再将其放回位后,再将其放回总体中参加下一次体中参加下一次抽取,抽取,这样连续抽抽n次即得到一个次即得到一个样本。
本u同同一一总体体单位有可能被重复抽中;位有可能被重复抽中;u每次每次都是都是从从N个个总体体单位中抽取;位中抽取;u n次次抽取抽取就是就是n次次相互独立的随机相互独立的随机试验n不重复抽不重复抽样,,也叫也叫不回置抽不回置抽样 ,指抽中,指抽中单位不再放回位不再放回总体中,下一个体中,下一个样本本单位只能位只能从余下的从余下的总体体单位中抽取位中抽取u同同一一总体体单位不可能被重复抽位不可能被重复抽中;中;u每次每次抽取是在不同数目的抽取是在不同数目的总体体单位中位中进行行的;的;un次次抽取可看作抽取可看作是是n次次互不独立的随机互不独立的随机试验 根据根据对样本要求的不同,抽本要求的不同,抽样方法又有方法又有考考虑顺序和不考序和不考虑顺序之分:序之分:n若若考虑顺序考虑顺序,构成单位相同但抽取顺序不,构成单位相同但抽取顺序不同的视为不同的样本;同的视为不同的样本;n若若不考虑顺序不考虑顺序,则可把构成单位相同但抽,则可把构成单位相同但抽取顺序不同的视为同一个样本取顺序不同的视为同一个样本 把上述两种分类结合起来,便形成可供选择的把上述两种分类结合起来,便形成可供选择的四种抽样方法:四种抽样方法: 但在抽样调查实践中,通常只讨论考虑但在抽样调查实践中,通常只讨论考虑顺序顺序的重复抽样的重复抽样及及不考虑顺序的不重复抽样不考虑顺序的不重复抽样两种两种情形下的可能样本数目。
情形下的可能样本数目 √ √ √ √ 不考虑顺序不考虑顺序考虑顺序考虑顺序不重复抽样不重复抽样重复抽样重复抽样不重复抽样不重复抽样重复抽样重复抽样返回六、抽样调查的组织方式六、抽样调查的组织方式1. 简单随机抽随机抽样((纯随机抽随机抽样))n含含义::又称又称纯随机抽随机抽样,是,是对被抽被抽样总体不做任何分体不做任何分组、排列,完全客、排列,完全客观地从地从中抽取中抽取调查单位是最基本、最位是最基本、最简单的的抽抽样组织形式n方法:方法:将将总体体单位位编成抽成抽样框,而后用框,而后用抽抽签或随机数表抽取或随机数表抽取样本本单位n适用:适用:总体体规模不大;模不大;总体内部差异小体内部差异小2. 类型抽型抽样(分(分层抽抽样))n含含义::又称又称分分层抽抽样,是先将,是先将总体所有体所有单位按某些重要位按某些重要标志志进行分行分类((层),),然后在各然后在各类((层)中独立地抽取)中独立地抽取样本本单位的一种抽位的一种抽样方式总总体体体体N N样样本本本本n n等额等额等额等额等比例等比例等比例等比例最优最优最优最优······3. 等距抽等距抽样(机械抽(机械抽样、系、系统抽抽样))n方法:方法:是先将是先将总体体单位按某一位按某一标志排序,志排序,然后按一定的距离抽取一个然后按一定的距离抽取一个总体体单位(个位(个体)的抽体)的抽样方式抽取方式抽取样本本单位。
位n例:例:从从100人中抽取人中抽取10人构成人构成样本,先将本,先将100人排人排队编号,然后在号,然后在1~~10号之号之间随机随机抽取一个数字,比如抽到抽取一个数字,比如抽到3,那么,那么编号号为 3,,13,,23,,33,,43,,53,,63,,73,,83,,93的的10个人个人组成成样本排序依据的排序依据的标志:(志:(1)无关)无关标志;(志;(2)有关)有关标志志4. 整群抽整群抽样n方法:方法:将将总体按某一体按某一标志分成若干志分成若干组 ,每,每一一组称称为一个一个群群,以群,以群为单位位进行行简单随随机抽机抽样,然后,然后对抽到的群抽到的群进行全面行全面调查的的抽抽样方式方式n分分层抽抽样::层内是抽内是抽样调查 , 层间是全是全面面调查n整群抽整群抽样::群内是全面群内是全面调查 , 群群间是抽是抽样调查例:例:总体群数体群数R=16 样本群数本群数r=4 样本容量本容量ABCDEFGHIJKLMNOPLHPD5. 多多阶段抽段抽样n方法:方法:将一次抽将一次抽样后得到的后得到的样本当作本当作总体体再次再次进行随机抽行随机抽样,得到第二次抽,得到第二次抽样样本,本,然后再如此然后再如此进行下去的抽行下去的抽样方式。
方式n例如:例如:我国农户生产性投资调查就采用四我国农户生产性投资调查就采用四阶段抽样方式省抽县、县抽乡、乡抽村、阶段抽样方式省抽县、县抽乡、乡抽村、村抽户、户抽样本点,对样本点进行调查村抽户、户抽样本点,对样本点进行调查n例:例:在某省在某省100多万多万农户抽取抽取1000户调查农户生生产性投性投资情况u第一第一阶段:从省内部段:从省内部县中抽取中抽取5个个县;;u第二第二阶段:从抽中的段:从抽中的5个个县中各抽中各抽4个个乡;;u第三第三阶段:从抽中的段:从抽中的20个个乡中各抽中各抽5个村;个村;u第四第四阶段:从抽中的段:从抽中的100个村中各抽个村中各抽10户样本本n=100×10=1000((户))返回七、抽样调查中的几个基本概念七、抽样调查中的几个基本概念n全及总体全及总体全及总体全及总体是指根据调查目的所确定的研究对象是指根据调查目的所确定的研究对象全体,简称为全体,简称为总体总体常用N表示总体单位数表示总体单位数n样本总体样本总体样本总体样本总体是指根据随机原则从总体中抽取一部是指根据随机原则从总体中抽取一部分单位所组成的整体分单位所组成的整体. .常用常用n表示样本单位数表示样本单位数((样本容量样本容量)。
一般一般 时,称为大样本;时,称为大样本; 时,称为小样本时,称为小样本对于某一研究对象,当研究目的确定时,对于某一研究对象,当研究目的确定时,全及总体全及总体是确定的,样本总体是不确定的是确定的,样本总体是不确定的一)全及总体与样本总体(一)全及总体与样本总体(二)总体指标与样本指标(二)总体指标与样本指标n总体指标:总体指标:总体指标:总体指标:根据总体中各单位的标志值计算出根据总体中各单位的标志值计算出来的用于反映总体的数量特征的指标又称为来的用于反映总体的数量特征的指标又称为全及指标全及指标或或母体参数母体参数①①总体平均数(体平均数(总体均体均值):):②②总体成数:体成数:③③总体体标准差:准差:N1是总体中具有某种特性个体数目是总体中具有某种特性个体数目针对数量标志针对数量标志针对是否标志针对是否标志①①样本平均数(本平均数(样本均本均值):):②②样本成数:本成数:③③样本本标准差:准差:n1是样本中具有某种特性个体数目是样本中具有某种特性个体数目对于某一研究对象,当研究目的确定时,对于某一研究对象,当研究目的确定时,总体指标总体指标是确定的,样本指标是不确定的。
是确定的,样本指标是不确定的n样本指标:样本指标:样本指标:样本指标:根据样本中各单位的标志值计算出根据样本中各单位的标志值计算出来的用于反映样本数量特征的指标称为样本指来的用于反映样本数量特征的指标称为样本指标,也称标,也称样本参数样本参数数量标志数量标志是否标志是否标志返回八、抽样推断中的理论依据八、抽样推断中的理论依据 大数定理表明:尽管个别现象受偶然因大数定理表明:尽管个别现象受偶然因素影响,有各自不同的表现但是,对总体素影响,有各自不同的表现但是,对总体的大量观察后进行平均,就能使偶然因素的的大量观察后进行平均,就能使偶然因素的影响相互抵消,消除由个别偶然因素引起的影响相互抵消,消除由个别偶然因素引起的极端性影响,从而使极端性影响,从而使样本平均数样本平均数稳定下来,稳定下来,反映出事物变化的一般规律反映出事物变化的一般规律 从正从正态分布的再生定理可以看出,只要分布的再生定理可以看出,只要总体体变量服从正量服从正态分布,分布,则从中抽取的从中抽取的样本,本,不管不管n是多少,是多少,样本平均数都服从正本平均数都服从正态分布 但是在客但是在客观实际中,中,总体并非都是正体并非都是正态分布。
分布对于从非正于从非正态分布的分布的总体中抽取的体中抽取的样本平均数的分布本平均数的分布问题,需要由,需要由中心极限定理中心极限定理来解决返回第二节第二节 抽样推断的原理抽样推断的原理抽样推断主要任务抽样推断主要任务抽样推断主要任务抽样推断主要任务: : 利用样本指标推断总体指标利用样本指标推断总体指标本章中即本章中即: 只要只要 ,则样本指标同总体指标之间就有,则样本指标同总体指标之间就有不同,即利用样本推断总体存在不同,即利用样本推断总体存在误差误差一、抽样误差一、抽样误差 抽样误差抽样误差是由于抽样造成的误差,是是由于抽样造成的误差,是由于用样本估计总体而产生的误差,无法由于用样本估计总体而产生的误差,无法避免,在概率抽样中,抽样误差事先可以避免,在概率抽样中,抽样误差事先可以计算并控制计算并控制1. 概念概念2. 影响因素影响因素n 总体标志变动度总体标志变动度总体标志变动度总体标志变动度各调查单位标志值之间的差异越大各调查单位标志值之间的差异越大抽样分布越分散抽样分布越分散抽样误差越大抽样误差越大即总体内各调查单位标志值之间即总体内各调查单位标志值之间无差异,则不存在抽样误差无差异,则不存在抽样误差n样本容量样本容量样本容量样本容量样本容量是影响抽本容量是影响抽样误差大小最直接、最有效的差大小最直接、最有效的因素;因素;n抽样方法、方式抽样方法、方式抽样方法、方式抽样方法、方式其他条件相同时,重复抽样误差其他条件相同时,重复抽样误差﹥不重复抽样的误差不重复抽样的误差从抽样方式上看,简单随机抽样、分层抽样、从抽样方式上看,简单随机抽样、分层抽样、系统抽样、整群抽样与多阶段抽样的抽样误差系统抽样、整群抽样与多阶段抽样的抽样误差也有区别。
也有区别其他条件相同其他条件相同时,,n 越接近越接近 N,,误差越小二、抽样误差的表现形式二、抽样误差的表现形式1. 抽抽样实际误差差抽样实际误差抽样实际误差指抽指抽样估估计值与与总体指体指标值之之间的离的离差,表示差,表示为::或或2. 抽抽样平均平均误差差抽样平均误差抽样平均误差指所有可能指所有可能样本抽本抽样误差的平均数差的平均数, 是抽是抽样误差的一般水平差的一般水平本章中主要本章中主要讲述:述:((((1 1))))简单简单随机抽随机抽随机抽随机抽样样的抽的抽的抽的抽样样平均平均平均平均误误差差差差n n对于重复抽样:对于重复抽样:对于重复抽样:对于重复抽样:n n对于不重复抽样:对于不重复抽样:对于不重复抽样:对于不重复抽样:修正系数修正系数当当 N 很大很大时,通常大于,通常大于 500,,N-1 近似近似为N,此,此时抽样比抽样比同理可得:同理可得: 当当 N 很大很大时3. 抽抽样极限极限误差差抽抽样极限极限误差差是指以是指以样本估本估计总体在某种概率意体在某种概率意义下所允下所允许的最大的最大误差范差范围,是估,是估计的的精度精度 抽抽样极限极限误差差与与抽抽样平均平均误差差之比的系数称之比的系数称为抽抽样概率度概率度 , 记为 t。
样本容量本容量较大大时,,t分布与分布与正正态分布差分布差别不大,用不大,用 表示三、总体指标的估计三、总体指标的估计1. 点估点估计也叫也叫定值估计定值估计,是以所抽样本资料为依据,直接,是以所抽样本资料为依据,直接根据所选择的估计量对总体指标作出一个确定值根据所选择的估计量对总体指标作出一个确定值的估计或或2. 区区间估估计以点估计为依据,用一个具有一定以点估计为依据,用一个具有一定可靠程度可靠程度的区间的区间范围来估计总体指标范围来估计总体指标可靠程度可靠程度即估计结果正确的即估计结果正确的概率大小概率大小对总体平均数的区间估计为:对总体平均数的区间估计为:对总体平均数的区间估计为:对总体平均数的区间估计为: 对总体成数的区间估计为:对总体成数的区间估计为:对总体成数的区间估计为:对总体成数的区间估计为: 或或或或例例例例1 1 某厂有某厂有某厂有某厂有15001500名工人,用名工人,用名工人,用名工人,用简单简单随机重复抽随机重复抽随机重复抽随机重复抽样样的方的方的方的方法抽出法抽出法抽出法抽出5050名工人作名工人作名工人作名工人作为样为样本本本本调查调查其工其工其工其工资资水平,水平,水平,水平,资资料料料料如下表所示:如下表所示:如下表所示:如下表所示: ((((1 1))))计计算算算算样样本平均数和抽本平均数和抽本平均数和抽本平均数和抽样样平均平均平均平均误误差;差;差;差; ((((2 2)以)以)以)以95.45%95.45%的可靠性估的可靠性估的可靠性估的可靠性估计该计该厂工人的月平均厂工人的月平均厂工人的月平均厂工人的月平均工工工工资资和工和工和工和工资总额资总额的区的区的区的区间间。
月工月工资水水平平x(元)(元)1240 1340 1400 1500 1600 1800 2000 2600工人数工人数f(人)(人)469108643例例例例2 2 为为了解某村了解某村了解某村了解某村12001200户农户农民的年收入状况,按照民的年收入状况,按照民的年收入状况,按照民的年收入状况,按照简单简单不重复不重复不重复不重复 抽抽抽抽样样方法,抽取一个有方法,抽取一个有方法,抽取一个有方法,抽取一个有8080户组户组成的成的成的成的样样本,所得的本,所得的本,所得的本,所得的资资料如料如料如料如表所示 ((((1 1))))试试求求求求该该村每村每村每村每户农户农民平均收入的抽民平均收入的抽民平均收入的抽民平均收入的抽样样平均平均平均平均误误差;差;差;差; ((((2 2)以)以)以)以95.45%95.45%的可靠性估的可靠性估的可靠性估的可靠性估计该计该村每村每村每村每户农户农民平均收入的区民平均收入的区民平均收入的区民平均收入的区间间年收入(千元)年收入(千元)家庭数家庭数f组中中值x4以下以下52-8.8387.204~886-4.8184.328~124010-0.825.6012~1620143.2204.8016以上以上7187.2362.88合合 计80——1164.80例例例例3 3 采用采用采用采用简单简单随机重复抽随机重复抽随机重复抽随机重复抽样样的方法,在的方法,在的方法,在的方法,在20002000件件件件产产品中品中品中品中抽取抽取抽取抽取200200件,其中合格品件,其中合格品件,其中合格品件,其中合格品190190件。
件 ((((1 1))))计计算合格品率及抽算合格品率及抽算合格品率及抽算合格品率及抽样样平均平均平均平均误误差;差;差;差; ((((2 2)以)以)以)以95%95%置信水平置信水平置信水平置信水平对对合格品率和合格品数量合格品率和合格品数量合格品率和合格品数量合格品率和合格品数量进进行区行区行区行区间间估估估估计计例例例例4 4 某机械厂生某机械厂生某机械厂生某机械厂生产产一批零件共一批零件共一批零件共一批零件共60006000件,按件,按件,按件,按简单简单随机不随机不随机不随机不重复抽重复抽重复抽重复抽样样的方法抽取了的方法抽取了的方法抽取了的方法抽取了300300件,件,件,件,发现发现其中有其中有其中有其中有9 9件不合件不合件不合件不合适,求合格率的抽适,求合格率的抽适,求合格率的抽适,求合格率的抽样样平均平均平均平均误误差 ((((1 1))))计计算合格品率及抽算合格品率及抽算合格品率及抽算合格品率及抽样样平均平均平均平均误误差;差;差;差; ((((2 2)以)以)以)以95.45%95.45%置信水平置信水平置信水平置信水平对对合格品率和合格品数量合格品率和合格品数量合格品率和合格品数量合格品率和合格品数量进进行区行区行区行区间间估估估估计计。
返回返回1. 类型抽型抽样(分(分层抽抽样))n含含义::又称又称分分层抽抽样,是先将,是先将总体所有体所有单位位按某些重要按某些重要标志志进行分行分类((层),然后在各),然后在各类((层)中独立地抽取)中独立地抽取样本本单位的一种抽位的一种抽样方式总总体体体体N N样样本本本本n n等比例等比例等比例等比例······四、其它抽样组织方式的计算四、其它抽样组织方式的计算则每个类型的平均数和方差分别为:则每个类型的平均数和方差分别为: 则样本总体的平均数和方差分别为:则样本总体的平均数和方差分别为:因此,可以计算抽样平均误差:因此,可以计算抽样平均误差:或或P148例5-32. 整群抽整群抽样n方法:方法:将将总体按某一体按某一标志分成若干志分成若干组 ,每一,每一组称称为一个一个群群,以群,以群为单位位进行行简单随机抽随机抽样,然,然后后对抽到的群抽到的群进行全面行全面调查的抽的抽样方式方式例:例:总体群数体群数R=16 样本群数本群数r=4 样本容量本容量ABCDEFGHIJKLMNOPLHPDn等群体整群抽等群体整群抽样的抽的抽样平均平均误差差计算。
算 设全及全及总体划分体划分为R群,每个群包含的群,每个群包含的单位数位数均相等,均相等,为M;从全及;从全及总体中随机抽取体中随机抽取r群群组成成一个一个样本,本,对抽中的抽中的r群中所有的群中所有的总体体单位位进行行调查根据样本数据,可以本数据,可以计算各群体的平均数算各群体的平均数则样本总体平均数为则样本总体平均数为 由于整群抽样都采用不重复抽样方法,且总体由于整群抽样都采用不重复抽样方法,且总体群数群数R通常不是很大,所以样本平均数的抽样平均通常不是很大,所以样本平均数的抽样平均误差为误差为其中,其中,δ2表示样本各群平均数间的方差,称为表示样本各群平均数间的方差,称为样样本群间方差本群间方差,即,即P149例5-43. 等距抽等距抽样(机械抽(机械抽样、系、系统抽抽样))n方法:方法:是先将是先将总体体单位按某一位按某一标志排志排序,然后按一定的距离抽取一个序,然后按一定的距离抽取一个总体体单位(个体)的抽位(个体)的抽样方式抽取方式抽取样本本单位排序依据的排序依据的标志:(志:(1)无关)无关标志;(志;(2)有关)有关标志志n由于采用由于采用无关无关标志志排排队的的总体体实质上是一上是一个随机个随机总体,故其抽体,故其抽样误差通常近似地按差通常近似地按简单随机抽随机抽样的的误差公式差公式计算。
算n采用采用有关有关标志志排排队的最大的最大优点在于可以充点在于可以充分利用分利用总体的有关信息,有益于提高体的有关信息,有益于提高样本本的代表性和抽的代表性和抽样的估的估计效果有关效果有关标志排志排队系系统抽抽样的抽的抽样误差差计算比算比较复复杂,可,可近似地用近似地用类型抽型抽样或或整群抽整群抽样的的误差公式差公式进行行计算 5. 多多阶段抽段抽样n方法:方法:将一次抽将一次抽样后得到的后得到的样本当作本当作总体再次体再次进行随机抽行随机抽样,得到第二次,得到第二次抽抽样样本,然后再如此本,然后再如此进行下去的抽行下去的抽样方式n主要讨论主要讨论两阶段抽样两阶段抽样的抽样平均误差计算的抽样平均误差计算n第一阶段:第一阶段:设全及总体划分为设全及总体划分为R群,每群的单位数群,每群的单位数为为Mi,从中随机抽取,从中随机抽取r群群n第二阶段:第二阶段:从抽中的从抽中的r群各抽出群各抽出mj个单位组成样本个单位组成样本n为简化起见,为简化起见, Mi=M;; mj =m,根据样本数据,可,根据样本数据,可以计算各群体的平均数以计算各群体的平均数 则样本总体平均数为则样本总体平均数为其中,其中, 表示表示样本群的群间方差样本群的群间方差,, 表示表示样本群样本群各群方差的平均数,各群方差的平均数,即即 由于多阶段抽样都采用不重复抽样方法,则有由于多阶段抽样都采用不重复抽样方法,则有样本平均数的抽样平均误差为样本平均数的抽样平均误差为返回第三节第三节 样本容量的确定样本容量的确定 抽抽样调查理理论中,中,样本容量本容量n的确定具的确定具有有实实在在的意在在的意义。
n过大,大,违背抽背抽样调查的宗旨,的宗旨,n过小,小,则抽抽样误差偏大,无法作差偏大,无法作出精确的估出精确的估计一、一、 影响因素影响因素1. 总体标志变动度总体标志变动度各调查单位标志值之间的差异越大各调查单位标志值之间的差异越大抽样分布越分散抽样分布越分散抽样误差越大抽样误差越大若想满足一定的精度要求若想满足一定的精度要求 , 则必须样本量就越多则必须样本量就越多2. 抽抽样推断可靠度和精确度要求推断可靠度和精确度要求要求越高要求越高, 所需所需样本量就越大本量就越大3. 抽抽样方法、方式方法、方式其他条件相同其他条件相同时,重复抽,重复抽样所需所需n﹥不重复抽不重复抽样所需所需n分分层抽抽样所需所需样本量最少本量最少, 整群抽整群抽样所需所需样本量最多本量最多衡量可靠度一般用衡量可靠度一般用t分布,衡量精确度一般用抽分布,衡量精确度一般用抽样误差差本章主要研究本章主要研究简单随机抽随机抽样下如何确定下如何确定 n 二、计算方法二、计算方法简单随机抽样下必备样本量的确定简单随机抽样下必备样本量的确定n对于重复抽样:对于重复抽样:同理可得:同理可得:n对于不重复抽样:对于不重复抽样:同理同理:例例例例5 5 用用用用简单简单随机重复抽随机重复抽随机重复抽随机重复抽样调查样调查方法方法方法方法确定某地区居民确定某地区居民确定某地区居民确定某地区居民的每的每的每的每户户平均收入,已知平均收入,已知平均收入,已知平均收入,已知标标准差准差准差准差为为5050元,要求置信元,要求置信元,要求置信元,要求置信水平水平水平水平为为95%95%,抽,抽,抽,抽样样极限极限极限极限误误差不超差不超差不超差不超过过1010元,元,元,元,问问需要需要需要需要抽抽抽抽查查多少多少多少多少户户?若其他条件不?若其他条件不?若其他条件不?若其他条件不变变,将抽,将抽,将抽,将抽样样极限极限极限极限误误差差差差缩缩小到原来的小到原来的小到原来的小到原来的1/31/3时时,抽,抽,抽,抽样样数目会怎数目会怎数目会怎数目会怎样变动样变动????例例例例6 6 为为了解某村了解某村了解某村了解某村12001200户农户农民的年收入状况,按照民的年收入状况,按照民的年收入状况,按照民的年收入状况,按照简单简单不重复不重复不重复不重复抽抽抽抽样样方法,抽取一个有方法,抽取一个有方法,抽取一个有方法,抽取一个有8080户组户组成的成的成的成的样样本,所得的本,所得的本,所得的本,所得的资资料如料如料如料如表所示。
表所示 ((((1 1)在例)在例)在例)在例2 2的条件下,若要求允的条件下,若要求允的条件下,若要求允的条件下,若要求允许误许误差不超差不超差不超差不超过过500500元,元,元,元,则则至至至至少要抽多少少要抽多少少要抽多少少要抽多少户调查户调查????((((2 2)若允)若允)若允)若允许误许误差差差差缩缩小至原来的小至原来的小至原来的小至原来的1/21/2,其他条件不,其他条件不,其他条件不,其他条件不变变,,,,则应则应抽抽抽抽查查多少多少多少多少户户年收入(千元)年收入(千元)家庭数家庭数f组中中值x4以下以下52-8.8387.204~886-4.8184.328~124010-0.825.6012~1620143.2204.8016以上以上7187.2362.88合合 计80——1164.80例例例例7 7 有一批送有一批送有一批送有一批送检产检产品,据品,据品,据品,据经验经验估估估估计计其一其一其一其一级级品率品率品率品率为为20%20%,成数,成数,成数,成数的最大允的最大允的最大允的最大允许许抽抽抽抽样误样误差不超差不超差不超差不超过过5%5%,在,在,在,在95%95%置信水平下,求:置信水平下,求:置信水平下,求:置信水平下,求: ((((1 1)用)用)用)用重复随机抽重复随机抽重复随机抽重复随机抽样样,必要抽,必要抽,必要抽,必要抽样单样单位数是多少?位数是多少?位数是多少?位数是多少? ((((2 2)抽)抽)抽)抽样样方法同上,若允方法同上,若允方法同上,若允方法同上,若允许误许误差减少差减少差减少差减少50%50%,其必要抽,其必要抽,其必要抽,其必要抽样单样单位数又位数又位数又位数又为为多少?多少?多少?多少?例例例例8 8 已知已知已知已知对对10001000件件件件产产品按品按品按品按简单简单随机不重复抽随机不重复抽随机不重复抽随机不重复抽样样的方式抽取了的方式抽取了的方式抽取了的方式抽取了150150件,件,件,件,合格品率合格品率合格品率合格品率为为96%96%。
1 1)若置信水平)若置信水平)若置信水平)若置信水平为为95%95%,是估,是估,是估,是估计该计该批批批批产产品合格率的可能范品合格率的可能范品合格率的可能范品合格率的可能范围围2 2)如果允)如果允)如果允)如果允许误许误差差差差扩扩大一倍,其他条件不大一倍,其他条件不大一倍,其他条件不大一倍,其他条件不变变,,,,则应则应抽抽抽抽查查多少件多少件多少件多少件产产品?品?品?品?返回End of Chapter 5。












