好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

夸大还是低估基于不同来源数据的出生性别比水平分析.pdf

9页
  • 卖家[上传人]:飞***
  • 文档编号:51448697
  • 上传时间:2018-08-14
  • 文档格式:PDF
  • 文档大小:91.77KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 夸大还是低估——基于不同来源数据的出生性别比水平分析翟振武杨凡2012-08-31 14:05:16 来源:《福建江夏学院学报》( 福州 )2011 年 1 期【内容提要】 中国的出生性别比从上世纪80 年代以来出现持续偏高的现象,我国目前公布的人口出生性别比的准确性成为各界争论的焦点通过对最新的公民身份信息数据、历年全国在校小学生人数统计数据、2000年第五次人口普查数据和 2005年 1% 人口抽样调查数据等几组不同来源的出生性别比数据进行质量评估、相互比对和分析,可以发现由于低年龄组女孩漏报、瞒报的原因,我国目前公布的人口出生性别比略有夸大,但是从程度上而言夸大不多,大概在2-3个百分点左右 即使扣除了这 2-3 个百分点的影响, 我国的出生性别比水平依然严重偏高,形势依然非常严峻关 键 词】出生性别比 / 漏报/ 数据质量一、对中国人口出生性别比水平的质疑中国出生性别比从上世纪80 年代以来出现持续偏高的现象,最高曾达到过121 的水平如此偏高的出生性别比水平, 究竟是真实的, 夸大的,还是低估的?学术界、统计界、政府部门对此一直有各种不同的观点通过对目前统计局公布的我国人口出生性别比数据进行分析,我们发现确实存在着一些疑点。

      图1 显示的是国家统计局公布的我国人口的出生性别比,2000-2009 年这 10年里,我国人口的出生性别比全都保持在115的水平以上,近 5 年甚至保持 120 左右的水平;而且这10 年中出生性别比一直在波动,忽高忽低,高低相间,并没有表现出趋势性的规律而且,统计局公布的我国人口出生性别比数据来源于每年的1‰人口变动抽样调查,经过比较可以发现,它所反映的历年出生性别比变化情况与全国1% 人口抽样调查数据所反映的出生性别比变化情况存在着一些不一致的地方比如在图 1 中,2002和 2003年全国 1‰人口变动情况抽样调查数据显示,从 2002年至2003年, 我国人口出生性别比有非常明显的下降, 从 2002年的 119.9 下降到 2003年的 117.5 而图 2 显示的是 2005年 1% 人口抽样调查中 0-9 岁人口分年龄性别比在以前的研究中,我们发现死亡因素对我国0-10 岁人口分年龄性别比的影响非常小,可以忽略不计 所以各年龄组儿童的分年龄性别比基本能反映出各同批人的出生性别比 [1] 因此,2005 年时 2 岁组和 3 岁组儿童的性别比分别能大致反映出 2003 年和 2002 年人口的出生性别比水平。

      从图2 可以看出, 2005年小普查时 2 岁组的性别比要高于3 岁组的性别比因此根据图 2 所提供的信息大致能推断出“ 2003年的出生性别比要高于2002年的出生性别比”的结论,这恰恰与从图 1 得到的判断是完全相反的数据来源: 2000 年全国第五次人口普查资料、2005年全国 1% 人口抽样调查资料及历年全国 1‰人口变动情况抽样调查资料可见,根据年度抽样调查数据计算的性别比波动性很大,而且其发展趋势和根据小普查调查数据计算的性别比发展趋势之间存在不一致的地方这就使我们对现在公布的出生性别比的质量产生了怀疑在单一来源数据可信度不高的情况下,需要使用其它来源的数据对我国的出生性别比水平进行估计本文的研究目的是利用最新的公民身份信息数据( 截至 2010 年 6 月 30 日) 、历年全国在校小学生人数统计数据、2000年第五次人口普查数据和2005年 1%人口抽样调查数据进行相互检验和比对,估计上世纪 90 年代至 2008 年全国出生性别比的水平及变动趋势二、基于不同来源数据性别比水平的分析( 一) 对 2000 年普查与 2005 年小普查数据的分析首先,我们将 2000 年普查 1-9 岁年龄组的分年龄性别比与2005 年 6-14 岁年龄组的分年龄性别比进行了比较( 图 3) ,检验同一部门不同调查数据间的内在一致性。

      2000年全国第五次人口普查中的1 岁人口到 2005年全国人口 1% 抽样调查时已经 6 岁,所以 2000 年普查时的 1 岁年龄组人口与 2005 年小普查时的 6岁年龄组人口应该属于同一个出生队列,其它年龄组依此类推 影响一个年龄组人口性别比的因素有出生、 死亡和迁移 既然他们是同一个出生队列, 出生因素对他们的作用是一样的, 即他们的出生性别比是一样的,而死亡因素和迁移因素对 0-14 岁人口的性别比的影响很小,可以忽略不计所以,从理论上推断,可以认为 2000年普查时的 1 岁人口组的性别比和2005年小普查时 6岁人口组的性别比应该是非常接近的 但是,通过两次调查数据的对比发现, 全国 2000年 1-9岁这 9 个年龄组人口的分年龄性别比都比全国2005年相对应的 6-14 岁这 9个年龄组人口的分年龄性别比要高而且随着年龄的推移,两者间的差距逐渐缩小,即年龄越高,这个年龄组人口 2000 年普查时的性别比与2005 年小普查时的性别比就越接近导致理论推断与现实差异的原因可能就在于低年龄组女孩的瞒报、漏报也就是说,在女婴出生时或者在女孩年龄较小时,瞒报、漏报的情况比较严重,使这些年龄组的性别比比真实水平有所升高。

      随着这些女婴和女孩的逐渐长大,敏感的时期已经过去, 调查或登记时家庭不再对她们的身份进行隐瞒,使这些在婴儿时期和幼年时期在统计数据上暂时“失踪”的女孩重新得以在统计数据上显示出来,这时该年龄组的性别比就会有所下降这就说明了由于女孩漏报、 瞒报因素的存在, 2000年普查数据、 2005 年小普查数据和人口变动抽样调查数据可能高估了我国的出生性别比水平 对于这种部门内数据间的系统性偏差,需要通过与其它来源的数据进行比对和调整,才能得以纠正 二) 对公安数据的分析公安数据是指公安部公民身份信息系统中的数据对于公安数据搜集过程和数据质量,我们在陕西和江西开展了实地调查进行评估户籍登记是日常性工作,户籍统计每年年底上报, 由各乡镇派出所上报到县公安局户政科,然后再逐级上报,有纸质和电子报表同时上报 《户口登记条例》要求婴儿出生一个月内进行户口登记,但实际上一些人在小孩户口需要时才来登记户口,如小孩上学必须要有户口,因此学龄儿童的户籍统计是比较完整、准确的对于户籍统计的年龄、性别状况,管理部门不存在任何影响和干扰其准确性的因素,影响的因素主要来自户口对老百姓的效用 因此户籍统计中 6 岁以上人口 ( 不包括老年人数据 ) 数据可靠性比较高, 6岁以下人口的数据年龄越低,数据覆盖越不完整。

      3-6 岁人口的数据有一定的参考价值, 但 0-2 岁人口的数据则需要经过调整和校正后才能应用到分析中近些年公安部在全国范围内部署开展了户口整顿工作,大批漏登、错登的情况得以纠正, 公安数据的质量也在进一步提高截至 2010 年 6 月 30 日,公安部统计的我国总人口达到13.39 亿,已经超过国家统计局公布的13.35 亿 虽然公安部数据大于国家统计局公布数据的一个原因是部分老年人口死亡而没有注销户口,但是数据中青年和中年的数据质量比较好) 从图 4 可以看出,将 2007 年的公安数据与 2010年的公安数据的分年龄、 性别数据进行对比, 各个年龄组的人数都有所上升 即同一个出生同批人, 在 2007年统计时人数少, 到 2010 年统计时人数增多 这说明许多 2007年时漏登的人在2010年时已经登记,被纳入系统之中而且,较低年龄组得以补充的人数较多,说明原来低年龄组漏报的程度更严重与此同时,2007年与 2010年进行对比,各个年龄组的性别比都有所下降(图 5)这说明在 2007-2010 年间被补充到公民身份信息系统的人之中,被补充的女孩数量较多,也就是说原来漏登的人当中,女孩漏登的比例比较大。

      特别是 2007 年 2-5 岁这几个年龄组, 到 2010年性别比下降幅度都达到 4 左右所以, 2010年公安部统计的数据虽然仍然存在一定的漏报,但在覆盖面上已经接近完整 在经过户口整顿工作以后, 使用 3 岁及以上的数据特别是6 岁及以上的数据进行回推和比对, 并对往年的出生性别比进行估计具有了更高的可靠性 三) 对教育数据的分析教育数据是指教育部统计的历年小学生在校人数数据我们以前的实地调查和研究分析表明, 分年龄小学在校生人数的教育统计数据比较准确:在从各村点清该上学人数, 到落实所有该上学者入学, 到统计在校学生人数, 到上报、汇总、再上报的各个环节中, 小学在校生人数基本上保持了其纯净性、真实性和可靠性而且特别是在教育数据统计和上报过程中,学生的性别和各当事人的利益几乎没有关系,所以各环节基本上不存在性别方面漏报、瞒报、多报的可能性[2] 所以,教育统计数据所反映的性别结构是比较准确的在之前的研究中,我们曾将2007 年教育数据与 2000 年普查数据进行对比,发现 7 年后的教育数据平均每个年龄比普查时的人数多出300 万左右,其中男性人数每组平均多出150 多万, 女性人数每组平均多出165 万。

      具体到每个年龄组,同一批人在 2007 年教育统计中的人数与2000 年普查男性相比,男性分别多出123 万、222 万、127万、136 万,女性分别多出118 万、227万、153 万、155万[3] 与此同时,这四个同批人在普查数据中的性别比也分别从117.79、122.65、 122.07 和 120.44 下降到 2007 年教育数据中的 115.70、 114.99、 114.55和 114.22这充分说明了普查数据低年龄组存在大量的漏报,而且女孩漏报的程度要明显高于男孩表1 显示的是 2000 年出生同批人在普查数据和历年教育数据测量中得到的性别比 可以观察到,连续 3 年教育统计测量得到的人数都比普查数据多出 240-260 万左右,性别比要比普查数据低2 左右而且这 3 年教育数据统计到的人数和性别比一直都十分接近,这充分说明了教育数据比较稳定,质量较好 四) 利用不同数据估计出生性别比通过以上分析, 我们得知存在着不同来源多套数据,通过这些数据都能计算出我国的出生性别水平 而且,不同数据的质量和通过这些数据计算得到的我国出生性别比水平存在着很大的差别那么,我国出生性别比的真实的水平到底是多少呢?我们将 2007 年公安数据、 2005 年小普查数据和 2007 年教育统计 6-10 岁组数据中分性别、年龄人数利用生命表回推, 得到各年龄组在出生时的分性别人数,最后计算出各年的出生性别比水平。

      三套数据对比的结果( 图 6) 显示:根据教育数据估计的出生性别比水平明显低于2007 年公安和 2005 年小普查数据我们又将 2010 年公安数据、 2005 年小普查数据、 2000年普查数据和历年教育统计 9 岁组数据中分性别、 年龄人数利用生命表回推, 得到各年龄组在出生时的分性别人数,最后计算出各年的出生性别比水平图7 列出了利用 2010 年公安数据、 2005年小普查数据、 2000 年人口普查数据以及历年教育数据9 岁年龄组数据回推的往年出生性别比, 显示出公安数据和教育数据在趋势上的高度一致性普查和小普查数据虽然在趋势上和教育数据也有一致性,但波动性更大 同时,根据教育数据估计的出生性别比水平低于2010 年公安数据,两者又都低于2005年小普查数据和2000年普查数据 普查和小普查数据之所以所显示的出生性别比在水平上也比教育数据、 公安数据高出许多, 主要是因为普查和小普查中低年龄组女孩的大量漏报所致而且,与2007 年公安数据的研究结果相比,根据 2010 年公安数据计算得到的出生性别比水平向根据教育数据计算得到的出生性别比水平靠拢 这说明公安数据通过查漏补缺,数据质量得到提高, 与真实的出生性别比水平更为接近。

      虽然我们认为教育数据的质量较好, 据其算出的出生性别比更能反映出我国出生性别比水平的真实状况,但在使用教育数据中7-10 岁年龄组回推估计出生性别比时。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.