
Chapter9受限因变量模型.doc
16页第1章 受限因变量模型这一章讨论响应变量仅仅被部分观测到的情况引入被部分观测到的潜在随机变量y*,y*的实际观测变量为yi引入二元指示变量Di,如果ai< y* 在这些假定条件下,yi*的均值为mi,方差为s2,分布函数为,概率密度函数为〔证明请参见附录1〕ai < yi* < bi等价于,那么yi*被观测到的概率为: 〔3〕下面对截断数据模型和归并数据模型分别进行介绍1.1 截断数据模型如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据比如,研究高收入阶层〔月收入x ³ 10000〕的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ³ 10000的区间里观测得到的下面介绍截断数据的分布特征和模型估计1.1.1 截断数据的分布特征如前面所述,截断数据只包括Di = 1情况下的数据截断分布是指变量高于〔低于〕某个设定值的未截断部分的分布如果变量只有在高于某一门限值a时才被观测到〔x > a〕,称之为从下面截断〔truncation from below〕或者是从左边截断〔truncation from left〕;如果变量只有在低于某一门限值b时才被观测到〔x < b〕,称之为从上面截断〔truncation from above〕或者是从右边截断(truncation from right)。 如下图图一 截断分布图〔上面截断〔左图〕、下面截断〔右图〕〕下面分析截断数据的分布函数、密度函数、均值和方差1. 截断变量的分布函数和密度函数给定模型〔1〕及相应的观测概率〔2〕,那么第i个观测变量yi的条件分布函数为〔证明请参见附录2〕: 〔4〕〔注:此处及后面的的定义均与前面相同〕密度函数为: 〔5〕从截断数据的密度函数〔4〕式我们可以推出从下面截断或从上面截断的各种不同分布的变量的密度函数读者可以参阅下面介绍的几个例子例1 截断均匀分布的密度函数和分布函数如果x*在区间[a,b]上服从均匀分布〔uniform distribution〕,那么, 〔6〕如果在x*= c处截断,即实际观测值x= x*,如果x*³c;x= c,如果x*< c这是左截断的例子,即右截断点=b根据〔5〕式,在x = c处截断的随机变量x的截断分布的密度函数为: 〔7〕分布函数为: 〔8〕例2 截断正态分布的密度函数模型设定为:,yi = yi*,如果 〔9〕yi = ai,如果yi = bi,如果其中vi~N(0, 1)。 即 yi*~N(mi, s2),其中mi、s分布表示yi的均值和标准差以f、F分别表示标准正态分布密度函数和分布函数那么: 〔10〕其中,根据截断正态分布的密度函数公式:可直接得到时yi的密度函数: 〔11〕根据截断正态分布的分布函数公式:可直接得到时yi的分布函数: 〔12〕图二 截断正态分布变量的累积分布函数图〔设潜变量y*~N(0, 1),图中虚线表示标准正态分布函数,实线表示截断正态分布函数,截断点为-1、1〕2. 截断变量的均值和方差截断随机变量的均值和方差称之为截断均值〔truncated mean〕和截断方差〔truncated variance〕,由下面的〔5〕、〔6〕式可以推出各种不同截断分布的均值和方差给定模型〔9〕,yi的均值为: 〔13〕 其中,yi的方差为: 〔14〕其中,。 〔证明请参见附录3〕例3:均匀分布的截断均值和截断方差给定模型〔6〕,截断变量x的均值和方差分别为: 〔15〕例4:正态分布的截断均值和截断方差给定模型〔9〕,那么yi的均值和方差分别为: 〔16〕其中,yi的方差为: 〔17〕其中,其中,f、F分别表示正态分布的密度函数和分布函数1) 如果ci-µ,即数据只是在右边截断,这时f( ci) = 0、F( ci) = 0,因此:<0 〔17a〕 〔17b〕〔2〕 如果di+µ,即数据只是在左边截断,这时f( di) = 0、F( di) = 1,因此:>0 〔18a〕 〔18b〕〔17a〕式中称之为Inverse Mills Ratio,将〔18a〕式中称之为风险函数〔Hazard Function〕。 结论1 即,如果变量为从上面截断,那么截断变量的均值小于初始变量的均值;如果变量为从下面截断,那么截断变量的均值大于初始变量的均值结论2 截断变量的方差低于初始变量的方差图三 截断分布的均值〔左图〕、方差〔右图〕(假定潜在变量y*~N(2, 2))1.1.2 截断回归模型估计下面以左截断模型为例说明截断回归模型的估计设回归模型为: (19)其中,vi~N(0, 1)根据例4,我们可以得到截断随机变量yi的均值和方差 (20)其中,, 〔21〕其中,由〔20〕式可以看出,截断均值为b和xi的非线性函数同一般的非线性模型一样,变量xk对y 的边际影响不等于其系数: 〔22〕因为,所以变量xk对y的边际影响要小于其系数yi的方差也存在类似的缩减〔attenuation〕: 〔23〕注: 对于yi < b的情况,可以得到相同的结论下面分析截断模型中参数的最小二乘估计和极大似然估计1. OLS估计根据,截断模型可以写为: 〔24〕其中,ui = svi为yi减去其条件期望,E(ui)=0。 如果以最小二乘法估计〔19〕式,就忽略了非线性项li,因此OLS估计量是有偏的另外,yi|yi>a的方差与ui的方差相同,由可知,yi存在异方差,为: 〔25〕它是xi的函数2. ML估计对于模型〔19〕,由截断随机变量的概率密度函数可得yi的密度函数为, , 〔26〕可以得到yi的对数似然函数: 〔27〕对于N个观测值(y1, …, yN),其联合对数似然函数为: 〔28〕通过最优化方法可以解得上式的参数b和s的值1.2 归并数据模型计量经济学当中经常能碰到数据的归并问题,简单地说,归并数据即是被解释变量在某个区间的观测值都转化为同一个值比如,研究电影院的座位需求情况,电影院总的座位是20000个如果实际的需求量少于20000,那么观测到的需求量就等于实际需求量;但如果实际需求量大于〔等于〕20000,那么实际可观测到的需求数量只能为20000这时我们说需求量数据被归并,即所有大于20000的数据都被归并为20000格林〔Greene,2000〕列举了经验文献中归并数据的应用。 其中包括:1, 家庭耐用品消费支出[Tobin(1958)] 2, 婚外情次数[Fair(1977,1978)]3, 劳动力市场中妇女工作的小时数[Quester and Greene(1982)]4, 罪犯重新入狱的次数[White(1980)]等下面分别介绍归并数据的分布特征和模型估计1.2.1 归并数据的分布特征如前所述,归并数据与截断数据的区别在于,归并变量包含D i = 1和D i = 0两种情况下的数据 〔29〕或者写作:即当时,所有值被归并为ai;当时,所有值被归并为bi归并数据按照归并点ai, bi是随机的还是确定的分为固定归并〔fixed censoring〕和随机归并〔random censoring〕两种如果ai, bi是确定性的,我们称之为固定归并;如果ai, bi是随机的,我们称之为随机归并本章只介绍固定归并的情况归并数据按照归并点与观测区间的关系还可以分为左边归并和右边归并如果:称潜在变量y*被从下面归并〔censored below〕或者从左边归并〔censored from left〕;如果:称潜在变量y*被从上面归并〔censored above〕或者从左边归并〔censored from right〕。 图 归并变量示意图1.归并变量的分布函数和密度函数给定基本模型〔1〕的假定,yi的分布函数为: 〔30〕归并变量的分布函数为一种混合分布〔连续型和离散型综合在一起〕在yi = ai和yi = bi两点的概率分别为和,因此对于同一个潜在变量,其归并变量和截断变量的分布函数不相同,在观测区间,归并分。
