
国家统计局等学者反驳.doc
17页施发启:也评王小鲁博士的灰色收入与国民收入分配中国统计信息网 2010-08-25 10:30:57凡个人署名文章,均不代表国家统计局观点,作者文责自负转载或引用时务请遵守本网“版权声明” 目前,我国居民收入是根据城乡住户调查资料推算的,受高收入户配合程度低、样本代表性不够强等因素的影响,住户调查数据可能存在低估的情况,因而城乡居民收入也有低估的可能但由于缺乏更可靠的资料,很难判断居民收入低估的程度,这也是国内外统计部门共同面临的一个难题王小鲁所长组织的城镇居民家庭收支调查以及在此基础上完成的《灰色收入与国民收入分配》报告,在估算我国居民实际收入方面进行了有益的探索,尤其在获取基础数据和推算宏观数据方面值得参考和借鉴 但这篇报告在调查样本、计算方法等方面还存在不少值得商榷之处,最终的推算结果也明显偏高 一、关于调查样本问题 一是样本量太小,代表性不足该项调查共包括家庭样本4909个,约为国家统计局的城镇住户调查样本量的7.6%,样本量明显偏小,无论是直接推算还是间接推算,以此为基础的计算结果都是不可靠的 二是没有按随机抽样原理来选取样本为了保证根据样本资料推算总体的可靠性,抽样调查要求按照随机抽样原理来选取样本。
该项调查由调查员主观选取调查户,利用这些样本点来推算全国城镇居民收入很可能会出现比较大的偏差 三是样本调查方法不规范该调查的家庭收入和消费数据是由受访者根据记忆提供的,没有规范的统计台账,调查数据的可靠性无从检验 二、关于推算方法问题 在推算全国居民收入过程中,该报告在指标界定、数据引用以及模型假定等方面也存在不少需要改进的地方 1、数据引用不合理 在推算全国居民可支配收入时,报告采用了城乡年末人口,而统计部门一般是用年平均人口按照该报告的计算方法,如果按城乡年平均人口推算,2008年全国居民可支配收入会比按城乡年末人口计算结果低0.6万亿元 2、间接推算方法存在明显的缺陷 由于这项调查未采用随机抽样,无法直接用调查样本数据来推算我国城镇居民收入的总体分布状况,因此,报告采用了间接推算方法,即恩格尔系数法和模型法但这一方法同样存在明显的问题,主要表现在: 一是恩格尔系数法假定恩格尔系数只与收入水平有关,这显然不符合实际情况实际上,恩格尔系数除了与收入水平有关外,还与消费品价格、饮食习惯、家庭规模、文化程度等有关 二是模型法采用虚拟变量来反映消费品价格、饮食习惯、文化程度等对恩格尔系数的影响,但拟合效果较差。
尽管该模型的解释变量系数通过了显著性检验,但拟合度只有0.2472,明显偏低 此外,模型对于解释变量在不同收入分组中的赋值存在较大主观性和随意性 三、推算结果明显偏高 根据报告中的模型法推算结果,2008年全国城镇居民人均可支配收入为32154元,是我局相应数据的2倍左右;全国居民可支配收入为23.2万亿元,比我局按城乡住户调查放大推算出的全国居民收入高出9.26万亿元,比2008年全国资金流量表中居民可支配收入高出5.3万亿元我们认为,这一推算结果明显高估了我国城乡居民收入水平如果采用报告中的计算结果,2008年居民可支配收入占GDP的比重将达到73.9%,占当年国民可支配总收入比重将达到72.6%,而当年全国财政收入占当年GDP比重为19.5%,政府可支配收入占国民可支配总收入比重为21.3%,按此推算,企业可支配收入占国民可支配收入比重仅为6.1%,这一结果明显是不合理的王有捐:也谈城镇居民收入的统计与调查方法中国统计信息网 2010.08.24 08:48:03日前,拜读了《第一财经日报》记者采访中国改革基金会国民经济研究所副所长王小鲁博士后撰写的报道《不应回避的灰色收入》一文,文中称王小鲁博士测算2008年城镇居民被统计遗漏的“隐性收入”高达9.26万亿元(注:约占当年GDP的30%多,加上这部分遗漏收入,全国居民收入为23.3万亿,约占当年GDP的77%),其中5.4万亿元是灰色收入。
为了获得更多的信息,笔者搜集了有关文献得知,2007年王小鲁博士也曾在《财经》杂志发表了《国民收入分配状况与灰色收入》一文摘要今年的报告是2007年报告的延续,采用的是基本相同的方法 王小鲁博士的有些观点我是赞同的如,在目前我国居民收入调查中,由于人们对隐私权更加重视,一定程度上确实存在着漏报和少报情况,高收入群体也较少进入调查样本王小鲁博士使用的调查方法,如,利用居民主要支出的数据来验证收入数据也有可借鉴之处但我认为王小鲁博士课题组使用的调查和估算方法有值得商讨之处,自然其估算结果也有过高之嫌故不揣冒昧,就教于王小鲁博士和各位学者 一、由“滚雪球法”调查得出的结论受主观因素影响较大 王小鲁博士课题组的调查方法是让调查者找自己的亲戚、朋友或者邻居来做调查,再通过这些人又找他们的亲戚、朋友或者邻居进行调查,从而取得居民收入和一系列消费结构方面的数据这种调查方法在社会学中被称之为滚雪球法抽样,该方法尽管最初选择调查对象时是采用随机抽样,但是最后的样本都是非概率样本这种方法在定性分析中较为有效,因为它可以大大地增加接触总体中所需群体的可能性,但是调查结果不适宜用来推断总体受研究目的和价值观等主观因素影响,不同研究者对同一研究群体会得出不同的结论。
报道中称课题组已经意识到滚雪球法抽样存在的局限性,只是把结果用来作为一些重要的居民收支行为的参数,但是,用这些参数作为辅助手段来推断总体同样也是不太合适的 报道中提到,研究人员认为滚雪球法抽样调查取得的数据具有较高的可信度,但是,这一结论是如何得来的则缺少说明试想,这些不愿意向统计局调查员透露自己实际收入的高收入人群会仅因为调查员是熟人就如实相告?这显然与中国几千年来的传统不相符,怕露富是常态,对熟人恐怕也是如此 二、调查城市和调查样本的选择方法存在主观性 根据抽样理论,概率抽样是推断总体的基础用非概率抽样(主观选择)获得的样本,仅能代表样本群体本身,若用其推断总体一般无法确定结论的可靠性,所以,使用这样的结果需要谨慎小心 报告中强调,为增加代表性,本年度调查比2007年的调查增加了调查城市和调查样本,但我们无法看到19个省份(包括直辖市)的64个调查市和14个调查县城及建制镇的4909个样本家庭是如何抽选的实际上,该课题所选城市较国家的城镇住户调查来说更多的集中于东、中部地区和大中城市,同时,有意识地增加了居住在较大规模城市、具有较高学历以及从事经营性活动和白领职业的人群比重,虽然其表明“在调查中我们使用的分析方法,使这种分布的差异不会影响到对全国城镇居民人均收入分布的推算结果”,但实际上,基于这样的样本所做的推算无疑将会高估居民收入。
我国现行城镇住户调查是按照随机抽样原则,在全国抽选了476个调查市县的65000个调查户进行居民收入与消费调查调查市县采用分层随机抽样的方法确定首先,将每个省(区、市)内的市县划分为三层:大中城市(地级和地级以上的城市)、县级市和县城(镇),按各层城镇人口占全省(区、市)城镇人口的比例来分配每层的样本量;其次,在各层内按市县城镇职工年人均工资水平从高到低排队,用与人口规模大小成比例的概率抽样抽取所需数量的调查市县,并根据抽中的次数确定调查市县的样本量在调查市县内采用两步抽选调查户第一步,按照多阶段、随机等距方法,抽选一相样本(俗称大样本)开展城镇居民基本情况抽样调查;第二步,从一相样本(或大样本)中按照家庭人均收入排队,等距抽选出一个小样本,作为常规调查户,开展记账工作每个调查户都可以计算入样概率,调查样本数据可用来推断总体国家统计局按照上述方法对调查样本的代表性进行了测算,结果表明65000户样本量对全国和分省(区、市)有较高的代表性,在置信度为95%时,主要收支指标的抽样误差(不含漏报、少报等产生的非抽样误差)在5%以内从理论上讲,国家组织的常规住户调查方法有着较严密的科学依据,是国际上普遍认可的。
三、恩格尔系数法在当今的中国似不足以作为推断居民收入的主要依据 该项研究中所采用的一个很重要的分析方法就是基于“在相同经济背景下具有相同恩格尔系数的两组居民,应当具有大体相同的收入水平”的判断来推算收入系数,并由此来校正城镇居民的收入数据,即所谓的“恩格尔系数法”这样做是否合理呢? 恩格尔系数是指食品消费支出在消费总支出中所占的比重一般情况下,恩格尔系数越低,代表居民生活水平越高但是,我们不能单纯地根据恩格尔系数的大小来测算居民收入的高低主要原因是,处在市场化进程中的中国,其消费结构与发达国家较为稳定的消费结构相比变动较大,而且中国地区分布广阔,不同地方的居民饮食结构和习惯存在明显的差异例如,从2008年36个大中城市居民的恩格尔系数来看,广州市为33.7%,上海市为36.6%,而呼和浩特市和长春市分别为32.2%和32.4%很明显,我们不能由此推断广州和上海市居民的生活水平比呼和浩特市和长春市低广州和上海两市恩格尔系数高的具体原因是:当地居民偏向于在吃上多花钱,在外饮食的支出远高出全国平均水平我们再看经济背景相近的东北三省,2008年辽宁、吉林和黑龙江城镇居民恩格尔系数分别为39.0%、34.0%和36.3%,三者差异较大,我们并不能得出吉林城镇居民生活水平就比黑龙江、辽宁要高的结论。
事实上,辽宁、吉林和黑龙江三省2008年城镇居民人均可支配收入分别为15836元、13606元和12264元,辽宁反而要高些 除收入水平、生活习惯因素外,恩格尔系数还受其他因素的影响恩格尔系数的变化是多因素影响的结果,不能单把这一变化归结为收入因素一方面的影响从长期趋势看,恩格尔系数与收入水平呈负相关性是正确的,但是,不能由此简单地推断:在短时期内(报告中是一年内),在相同经济背景下,有相同恩格尔系数的家庭就有相同的收入水平的结论 四、通过外部数据验证隐性收入的严谨性值得考虑 课题研究中采用居民购房、汽车拥有量、出境旅游等数据对住户调查的收入数据进行验证,对于我们加强各种统计调查数据之间的关联性评估很有借鉴意义,但是,文中在使用外部数据进行验证时,对口径、范围、概念的一致性处理方法不够严谨,有待于进一步探讨这些外部数据很多是无法清楚地区分是否属于居民拥有,比如储蓄存款,就不能清楚区分哪些属于居民储蓄?哪些属于公款私存?对于购房,也无法确切区分,哪些属于居民购买?哪些属于单位购买?对于股市私人投资,也无法区分,哪些属于居民投资?哪些属于企业投资?哪些属于国外资金?在进行收入比较时,把居民与私营企业,把货币收入与所有者权益增加混为一体,这样做势必会高估比较差异。
房价收入比在中国的合理界限为3年的提法也有待于进一步探讨房价收入比是一个有严格内涵的概念,具体应用时要注意其到底是什么情况下的房价收入比在西方,房价收入比有新建住宅的(新房交易),也有旧有住宅的(二手房交易)我国的房价收入比的统计尚无如此完备的信息,在市场化进程不断加快的中国,房价收入比的合理界限到底为多少?理论界对此存在着诸多争议而该研究援引国际经验说明住宅的平均价格一般不超过居民家庭平均年收入的3倍,并根据3倍的房价收入比推算出已经购买商品住宅的家庭收入一般在10万元以上这一结论与实际有很大的出入举个例子,假如某家庭购买了150万元的住房,我们就推断该家庭的年收入大约就在50万元以上,对比身边的实际买房者,此现象并不多见 根据联合国公布的有关资料,1998年对96个国家的统计结果表明,这些国家的房价收入比区间为0.8~30,平均值为8.4、中位数为6.4不同国家房价收入比的离散程度相当大换言之,依照购房者的。












