好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

样本量为1000的抽样方法.docx

8页
  • 卖家[上传人]:公****
  • 文档编号:378871229
  • 上传时间:2023-03-11
  • 文档格式:DOCX
  • 文档大小:13.01KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 样本量为1000 的抽样方法一般情况下,确定样本量需要考虑调查的目的、性质和精度要求以及实际操 作的可行性、经费承受能力等根据调查经验,市场潜力和推断等涉及量比较严格 的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求 不是很严格的调查,样本量相对可以少一些实际上确定样本量大小是比较复杂的 问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、 调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小但是这只 能原则上确定样本量大小具体确定样本量还需要从定量的角度考虑从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式归 纳起来,样本量的大小主要取决于:(1)研究对象的变化程度,即变异程度;(2)要求和允许的误差大小,即精度要求;(3)要求推断的置信度,一般情况下,置信度取为 95%;(4)总体的大小;(5)抽样的方法也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越 高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大, 但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效 应的值,如果我们设定简单随机抽样设计效应的值是 1;分层抽样由于抽样效率高 于简单随机抽样,其设计效应的值小于 1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1 的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于 1,所以抽样调查方法的复杂程度决定其样本量大小。

      对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽, 这种说法原则上是不对的实际上,在大城市抽样太大是浪费,在小城市抽样太少 没有推断价值二、样本量的确定方法如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定 时,不同的样本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以 使用简单随机抽样计算样本量的公式去近似估计其他抽样方法的样本量,这样可以 更加快捷方便,然后将样本量根据一定方法分配到各个子域中去所以,区域二相 抽样不能计算样本量的说法是不科学的1.简单随机抽样确定样本量主要有两种类型:(1)对于平均数类型的变量对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量已知 期望调查结果的精度(E),期望调查结果的置信度(L),以及总体的标准差估计值 o 的具体数据,总体单位数 N计算公式为:n=02/( e2/224o2/N)特殊情况下,如果是很大总体,计算公式变为:n二Z03/e?例如希望平均收入的误差在正负人民币30元之间,调查结果在95%的置信范 围以内,其 95%的置信度要求Z的统计量为1.96根据估计总体的标准差为150元,总体单位数为 1000。

      样本量:n = 150*150/( 30*30/( 1.96壮96 )) +150*150/1000)=88(2)于百分比类型的变量对于已知数据为百分比,一般根据下列步骤计算样本量已知调查结果的精度 值百分比(E),以及置信度(L),比例估计(P )的精度,即样本变异程度,总体 数为 N则计算公式为:n = P (1-P)/( e2/z2 + P( 1-P )/N )同样,特殊情况下如果 不考虑总体,公式为:n二ZP( 1-p )/e2 —般情况下,我们不知道P的取值,取其 样本变异程度最大时的值为 0.5例如:希望平均收入的误差在正负0.05之间,调查结果在95%的置信范围以 内具95%的置信度要求Z的统计量为1.96估计P为0.5,总体单位数为1000样本量为:n=0.5*0.5/( 0.05*0.05/ ( 1.96壮96 ) +0.5*0.5/1000 ) =2782.样本 量分配方法以上分析我们获得了采用简单随机抽样公式计算得到的样本量,总的样本量需 要在此基础上乘以设计效应的值得到由于样本总量已经确定,我们采用总样本量 固定方法分配样本,这种方法包括按照比例分配和不按照比例分配两类。

      实际工作 中首先计算取得区县总的样本量,然后逐级将其分配到各阶分层中,如果不清楚各 阶分层的规模和方差等,—般采取比例分配或者比例平方根分配法如果有—定辅 助变量可以使用,可以采用按照规模分配法分配样本量3.样本量和总体大小的关系:在其它条件一定的情况下,即误差、置信度、抽样比率一定,样本量随总体的 大小而变化但是,总体越大,其变化越不明显;总体较小时,变化明显其变化 趋势如下:二者之间的变化并非是线性关系所以,样本量并不是越大越好,应该 综合考虑,实际工作中只要达到要求就可以了三、抽样调查方案样本量的确定我们决定首先采取简单随机抽样的方法计算区县的样本量,之所以首先对区县 计算样本量,主要是考虑,虽然我们方案中没有要求对区县的估计量,但是区县一 级是我们做计划和决策的基础,具有承上启下的作用,如果区县级获得的估计量精 度比较高,就可以保证上级的估计量具有更高的精度,而且各个区县的样本量可以 认为是相同的,这主要是因为各个区县的总体数都比较多,而且我们也不清楚;同 时也不可能事先进行区县方差估计没有首先计算区县以下各阶分层的样本量,主 要是考虑:(1)如果计算区县以下某阶分层的样本量,然后再将计算的样本量合并,将 显著增加样本量,增加基层的负担。

      2)事实上,对于计算阶可以比较好的得到它的估计量,但我们现在不需要 得到区县以下各阶分层的估计量,我们仅仅需要区县的估计量,没有必要计算区县 以下阶样本量3)我们直接对整个区县以简单随机抽样进行抽取,然后将其样本量合理分 配到各阶分层中,这样可以使用较少样本量得到区县较好的估计量以下我们以试点地区批零业为对象进行研究由于没有误差限以及置信度和抽 样比率的值我们可以采用常用参数:设定区县总体为很大,置信度是95%,抽样 比率保守估计是0.5,抽样误差不能大于 15%,根据公式计算得到样本量为 43 个 由于采取多阶分层抽样,我们如何设定抽样设计效应呢?区县及以下是三阶分层抽 样,只要在各阶进行合适的分层,其设计效应应该在2-3 之间,我们在这里取保守 值3,那么得到本区县样本量是129 个,这个样本量就可以根据新方案得到区县要 求误差内的估计值1.确定办事处、居委会、村委会样本量根据方案,每个居委会抽取样本 5-10 个,那么这个样本量是否可行呢?这里 涉及如何将区县样本分配到街道和居委会中去,根据方案要求,街道抽取采取先分 层,后对层内进行 PPS 抽样;那么分配样本是否也采取同样方法呢?主要看辅助变 量与样本量之间的关联程度,方案中提供了两个辅助变量:人口数和个体数,对于 辅助变量是个体数的完全可以使用规模分配方法分配样本量,个体数多的分配较多 的样本量;对于辅助变量是人口数的如果采取规模分配方法,由于人口数与一个地区的个体单位数没有必然的联系,可能 导致某些居委会的个体数比较多,却分配了较少的样本量,使得居委会分层变的困 难,同时使居委会方差显著增大。

      而获得较多样本量的居委会,分层的效果和方差 提高幅度有限,故采用比例分配的方法可能更加合适一些对于居委会村委会的抽 取,由于本阶可能存在市场内的抽样,分配复杂一些;如果本阶有市场内抽样,可 以适当减少居委会村委会的样本量,但应该大于本阶样本量的 80%,由于市场内抽样的特殊性,建议将本阶样本量全部分配给居委会村委会,我们所进行的试点就是 将样本全部分配给居委会;至于市场内抽样的具体实施,可以根据方案操作完成 对居委会村委会层内,由于使用简单随机抽样完成,采用比例分配平均分配就可在实际工作时,由于一个区县包括全部乡镇街道或其中的一个;根据方案,区 县抽取办事处的数量应该介于 12-4 个之间,对应于抽中乡、镇、街道的全部或其 中一个,那么其每一个乡镇街道采取比例分配平均分配的样本量应该是11-32 个之 间;所抽中的居委会、村委会数量应该介于16-48 个之间,如果个别乡镇街道抽中 的居委会是2 个,则其居委会总数相应减少一些;最后,每个居委会、村委会的样 本量应该介于3-16 个之间,大部分介于5-10 之间以上的讨论没有考虑总体的大小,如果考虑到居委会、村委会的总体有限,则 每个居委会村委会的样本量可以减少一些,具体可以采用以下公式得到具体样本量 的调整数;样本量n二n1*N/ (N + n1 )。

      N是本地区总体,n1是给本地区分配样本 量居委会样本量的调整数,应该作为本居委会样本量的底限确定办事处、居委会 村委会的样本量,与以下几点有关:a )估计量的误差、置信度,可以决定简单随机抽样的样本量b)与采用的抽样 方法有关系,它决定了设计效应的大小例如:分层抽样的设计效应值小于 1,多 阶抽样的设计效应值大于 1可以决定整个抽样的样本量c)与每一阶的分层的数目有关系,所以,应该重点考虑分层的问题,分层太多,没有必要;分层太少,导致层内的方差增大,可能影响估计值的精度以及设计效应的值,所以,在每阶分层时,应该合理考虑,使得样本的变异程度在层内达到 一个合理水平根据以上原则,我们在包头的抽样试点共抽取 4 个办事处,包括14 个居委会; 一个乡,包括4个村委会,经过清查共有批零业1042 个,单位70个;餐饮业250 个,单位3 个由于我们使用人口数作为辅助变量,应该采用比例分配方法平均分 配样本量,这样每个街道办事处得到26 个样本,对于抽取4个居委会的办事处, 每个居委会分配得到 7 个样本;对于抽取2 个居委会的办事处,每个居委会分配到 13 个样本然后根据居委会总体对样本量做出调整,得到居委会实际样本量。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.