
统计学教学案例汇集(共46页).doc
46页统计学教学案例集统计学精品课建设小组2004年11月【案例一】 全国电视观众抽样调查抽样方案一、调查目的、范围和对象1.1 调查目的准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、开展电视观众行为研究提供新的依据1.2 调查范围全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域1.3 调查对象全国城乡家庭户中的13岁以上可视居民以及4-12岁的儿童包括有户籍的正式住户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居住6个月以上,都包括在内不包括住在军营内的现役军人、集体户及无固定住所的人口二、抽样方案设计的原则与特点2.1 设计原则抽样设计按照科学、效率、便利的原则首先,作为一项全国性抽样调查,整体方案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性其次,抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽可能高,也即目标量估计的抽样误差尽可能小第三,方案必须有较强的可操作性,不仅便于具体抽样的实施,也要求便于后期的数据处理。
2.2 需要考虑的具体问题、特殊要求及相应的处理方法2.2.1 城乡区分城市与农村的电视观众的收视习惯与爱好有很大的区别理所当然地应分别研究,以便于对比最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做的样本点数量较大,调查的地域较为分散,相应的费用也就较高另一种处理方式是在第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再区分城、乡这样做的优点是样本点相对集中,但数据处理较为复杂综合考虑各种因素,本方案采用第二种处理方式在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村2.2.2 抽样方案的类型与抽样单元的确定全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,其中尤以第一阶抽样单元最为重要本项调查除个别直辖市及城市外,不要求对省、自治区进行推断,从而可不考虑样本对省的代表性在这种情况下,选择区、县作为初级抽样单元最为适宜因为全国区、县的总数量很大,区、县样本量也会比较大,因而第一阶的抽样误差比较小另外对区、县的分层也可分得更为精细本抽样方案采用分层五阶抽样各阶抽样单元确定为:第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);第二阶抽样:街道、乡、镇;第三阶抽样:居委会、村委会;第四阶抽样:家庭户;第五阶抽样:个人。
为提高抽样效率,减少抽样误差, 在第一阶抽样中对区、县采用按地域及类别分层在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样2.2.3 自我代表层的设立根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都作为单独的一层处理为方便起见,以下把这样的层称为自我代表层考虑到在这样处理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自我代表层处理另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,因此也将它作为自我代表层处理这样自我代表层共有8个,包括以下城市与地区:北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区三、样本区、县的抽选方法3.1 全国区、县的调查总体根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同一个市辖区,则共有792个区;全国共有1674个县(包括自治县及旗、自治旗、特区与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此次调查的调查总体。
3.2区、县分层为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层分层可以按多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量在本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量关于这方面已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习惯与气候等不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来分类而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在省的人文发展指数及县的人均GPT)的资料都无法得到,经过多方研究,我们对区县的分层按以下两种标识进行1)地域我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都与电视观众的收视行为密切相关我们首先将所有县按所在省(自治区、直辖市)的地理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(Human Development Index,简称HDI),在全国的排位,参见附表]地域分层如表1:表1 全国区、县的地域分层大层所含省、自治区、直辖市第一大层(东部地区)子层10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)子层11:辽宁(5)、山东(9)子层12:江苏(7)、浙江(6)子层13:福建(8)、广东(4)、海南(13)第二大层(中部地区)子层21:黑龙江(10)、吉林(12)子层22:河北(11)、河南(18)、山西(16)子层23:安徽(20)、江西(23)子层24:湖北(14)、湖南(17)第三大层(西部地区)子层31:内蒙古(21)、新疆(15) 、宁夏(26)子层32:陕西(25)、甘肃(28)、青海(29)子层33:重庆(22)、四川(24)子层34:广西(19)、云南(27)、贵州(30)子层30:西藏(自我代表层)需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计算的人文发展指数仅是考虑因素之一。
例如,按人文发展指数,广西(第19位)实际上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,我们的划分与它一致,这样便于资料的汇总发布又如海南,根据人文发展指数(第13位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为而言,与广东、福建划在一子层内是合理的2)区、县类别同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程度有较大差异我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽样总体)分成以下5类,每类组成1个小层:一类区,二类区,县级市,一类县,二类县全国抽样总体中所有区县共分成115=55个小层其中区的划分标准为区中非农业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划分标准为人均国内生产总值,高的为一类县,低的为二类县区县划分类别的标准在三大层中各不相同,具体标准如下:区类别的划分标准:东部地区与中部地区:非农人口在总人口中的比例大于或等于80%为一类区,小于80%为二类区;西部地区:非农人口在总人口中的比例大于或等于70%为一类区,小于70%为二类区。
县类别的划分标准:东部地区:人均GDP在5000元以上为一类县;5000元以下为二类县中部地区:人均GDP在4000元以上为一类县;4000元以下为二类县西部地区:人均GDP在3000元以上为一类县;3000元以下为二类县3.3自我代表层的区、县情况根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1 表2 自我代表城市的辖区、县构成城 市一类区二类区直辖市中的县及其它县级市县总计北京市855-18天津市774-18上海市973-19广州市552-12成都市524819长沙市23139西安市440513西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)及71个县3.4 抽样总体区县情况按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在(抽样总体)总人口中的比例如表3与表4所示表3 抽样总体中各小层的区县数地域子层一类区二类区县级市一类县二类县合计东部地区114362471968239东部地区123047533137198东部地区132441515942217中部地区215626403632190中部地区22396756140148450中部地区232634193195205中部地区242044394269214西部地区31278349161221西部地区3211161551131224西部地区33542145585201西部地区3419273074175325合计3004143986299432684表4 抽样总体各小层人口占总人口的比例(%)地域子层一类区二类区县级市一类县二类县合计东部地区111.35122.27663.17280.76723.629511.1972东部地区120.69921.64873.88321.41052.28099.9226东部地区130.5083 1.2187 3.4437 2.3497 1.7150 9.2354 中部地区211.0200 0.5023 1.7709 1.1035 1.0037 5.4004 中部地区220.9263 1.9128 2.7858 4.5291 6.3593 16.5133 中部地区230.5272 1.1800 1.0682 1.1637 4.9385 8.8776 中部地区240.6106 1.5928 2.5415 2.2757 3.2519 10.2726 西部地区310.4343 0.2219 0.7319 1.2265 1.3692 3.9838 西部地区320.2976 0.5513 0.4257 0.7233 3.0567 5.0546 西部地区330.1454 2.1132 0.9581 1.8715 3.8961 8.9843 西部地区340.3629 0.9478 1.3254 2.6499 。












