
会计财务管理研究方法论第七讲上海国家会计学院张人骥.ppt
65页SNAI-R&D DepartmentSNAI-R&D Department会计与财务研究方法论Some Possible Problems in Empirical Accounting and Finance Nov 2008•内生性内生性2How to Solve the Endogeneity Problem•1) 2SLS•2) 增加新的解释(控制)变量•内生性问题在CG(公司治理)上是严重的3•例子:Ø权益资本成本披露的影响.Ø外资对公司业绩的影响(使用A- and B-share公司)Ø公司治理机制对盈余管理的影响.Ø机构投资者对薪酬比例的影响(在中国股权分置改革).4•The Key problem to solve the endogenous problem is 找出一个合适的工具变量 (2SLS) and 合适的控制变量. •How to find the approximate instrumental variables and extensive control variables? --- Prior literature (the determinants of 机构投资者 and 公司治理).5机构投资者行为问题中的内生性机构投资者行为问题中的内生性•Gompers and Metrick (2001) :发现机构投资者持股是与公司规模,B/M比例,波动性,收益率等因素有系统性的关联. •Hang and Wang (2005)发现机构投资者追随大的,高价位的,高盈利的,有价值的,以及以往有高收益的而当前较低流动性的股票.6•基于以往的文献,关于机构持股的研究,可以考虑公司规模,B/M比例,波动性,收益率和ROE 都将是有力的工具变量。
•注意:合适的工具变量都和机构持股的度量紧密相关的,并且影响应变量 •因为B/M比和波动性是两个决定性变量,所以不能把它作为工具变量,而在其它度量中选择工具变量7•两阶段回归是处理内生性问题的有力方法,特别在研究机构投资者行为和公司治理问题中•合适的工具变量也可用于分析和检验内生性效应的显著性•(几个工具变量, firm size (总资产的自然对数), profitability (ROA), turnover ratio (volume divided by outstanding shares), momentum (the firm’s past 12-month return), and the stock price of floating shares at a trading day8•6 Basic Assumptions of OLS Regression9不满足基本假定的情形(不满足基本假定的情形(2))•4、解释变量之间相关=>多重共线性•5、随机扰动项相关=>序列自相关Ø时间序列数据经常出现序列相关•6、随机扰动项方差不等于常数=>异方差Ø截面数据时,经常出现异方差12•Multi-Collinearity(多重共线性)(多重共线性)13•多重共线性的后果多重共线性的后果•多重共线性的检验多重共线性的检验•克服多重共线性的方法克服多重共线性的方法14多重共线性的后果1、完全共线性下参数估计量不存在如果存在完全共如果存在完全共线性,性,则(X’X) -1不存在,无法得不存在,无法得到参数的估到参数的估计量。
量152、近似共线性下普通最小二乘法参数估计量很难通过显著性检验 在近似共线性下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为 可见,由于此时|X’X|0,引起(X’X) -1主对角线元素较大,从而使参数估计值的方差增大,OLS参数估计量难以通过显著性检验163、参数估计量经济含义不合理 如如果果模模型型中中两两个个解解释释变变量量具具有有线线性性相相关关性性,,例例如如X1和和X2,那么它们中的一个变量可以由另一个变量表征那么它们中的一个变量可以由另一个变量表征 这这时时,,X1和和X2前前的的参参数数并并不不反反映映各各自自与与被被解解释释变变量量之之间的结构关系,而是反映它们对被解释变量的共同影响间的结构关系,而是反映它们对被解释变量的共同影响 所所以以各各自自的的参参数数已已经经失失去去了了应应有有的的经经济济含含义义,,于于是是经经常常表表现现出出似似乎乎反反常常的的现现象象,,例例如如本本来来应应该该是是正正的的,,结结果果恰是负的恰是负的17多重共线性的检验•1、如果方程只有两个自变量, 使用相关系数法检验(>0.8);18•2、如果方程含三个以上自变量:使用方差扩大因子法检验(VIF>5).•3、经验准则: Adjusted R2大,F值显著大于临界值,而t值不显著;那么很可能存在多重共线性。
19Multi-Collinearity Modifications•1、剔除共线性变量(逐步回归法)•以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计•根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释变量•如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;•如果拟合优度变化很不显著,则说明新引入的变量不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存在共线性关系20•2、差分法•3、改用相对变量的形式 •4、增加样本量,减少参数估计量的方差•5、PCA(主成分分析法)•6、如果自变量之间的多重共线性是由于因果关系造成的,可使用2SLS方法解决21•Heteroscedasticity (异方差)(异方差)22•异方差的后果异方差的后果•异方差的检验异方差的检验•克服异方差的方法克服异方差的方法23异方差的后果1 1、参数估计的无偏性仍然成立、参数估计的无偏性仍然成立 参数估计的无偏性仅依赖于基本假定中的随机项均值为零所以异方差的存在对无偏性的成立没有影响2 2、参数估计的方差不再最小、参数估计的方差不再最小 同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。
243、对参数显著性检验的影响、对参数显著性检验的影响由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的t统计量值不能正确确定,所以,如果仍用t统计量值进行参数的显著性检验将失去意义4、对预测的影响对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数估计量不是有效的,从而对Y的预测也将不是有效的 25 异方差检验Goldfeld-Quanadt检验 ●●作用:检验递增性作用:检验递增性( (或递减性或递减性) )异方差 ● ●基本思想:将样本分为两部分,然后分别对两个样本基本思想:将样本分为两部分,然后分别对两个样本进行回归,并计算两个子样本的残差平方和所构成的进行回归,并计算两个子样本的残差平方和所构成的比,以此为统计量来判断是否存在异方差比,以此为统计量来判断是否存在异方差一)(一) 检验的具体程序检验的具体程序 1 1、排序、排序 将解释变量的取值按从小到大排序将解释变量的取值按从小到大排序 2 2、数据分组、数据分组 将排列在中间的约将排列在中间的约1/41/4的观察值删除掉,记为的观察值删除掉,记为c c,再将,再将剩剩 余的分为两个部分,每部分观察值的个数为余的分为两个部分,每部分观察值的个数为(n-c)/2(n-c)/2。
263 3、提出假设即、提出假设即 ::4 4、构造、构造F F统计量统计量分别对上述两个部分的观察值运算回归方程,由分别对上述两个部分的观察值运算回归方程,由此得到的两个部分的残差平方和此得到的两个部分的残差平方和F F统计量为前一部分样本回归产生的残差平方和统计量为前一部分样本回归产生的残差平方和 与后一部分样本回归产生的残差平方和之比它与后一部分样本回归产生的残差平方和之比它们的自由度均为们的自由度均为[(n-c)/2]-k[(n-c)/2]-k,,k k为参数的个数为参数的个数27•5 5、给定显著性水平,查、给定显著性水平,查F F分布表得临界值分布表得临界值F*F*,如果,如果F>F*, F>F*, 则拒绝原假设,接受备择假设,即模型中的随机误差存在则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差•注意,这种检验方法,只能判断异方差是否存在,在多个注意,这种检验方法,只能判断异方差是否存在,在多个解释变量的情况下,对哪一个变量引起异方差的判断存在解释变量的情况下,对哪一个变量引起异方差的判断存在局限28White检验基本思想:基本思想: 不需要关于异方差的任何先验信息,只需不需要关于异方差的任何先验信息,只需要在大样本的情况下,将要在大样本的情况下,将OLSOLS估计后的残估计后的残差平方对常数、解释变量、解释变量的平差平方对常数、解释变量、解释变量的平方及其交叉乘积等所构成一个辅助回归,方及其交叉乘积等所构成一个辅助回归,利用辅助回归建立相应的检验统计量来判利用辅助回归建立相应的检验统计量来判断异方差性。
断异方差性 29检验的基本步骤:: 以一个二元线性回归模型为例,设模型为:以一个二元线性回归模型为例,设模型为:并且,设异方差与并且,设异方差与 的一般关系为的一般关系为 ((1 1)) 其中其中 为随机误差项为随机误差项301、求回归估计式并计算用OLS估计方程(1),计算残差 并求残差 的平方 2、求辅助函数用残差平方 作为异方差 的估计,并建立 的辅助回归,即3、计算 利OLS估计方程(2)得到辅助回归函数的 ,n为样本容量2 2)) 314、提出假设 中至少有一个不为零,5、检验 在零假设成立下,有 渐进服从自由度为5的 分布。
给定显著性水平 ,查 分布表得临值 ,如果 > ,则拒绝原假设,表明模型中随机误差存在异方差 注意:注意:White检验不仅能够检验异方差的存在性,同检验不仅能够检验异方差的存在性,同时在多变量的时在多变量的 情况下,还能判断出是哪一个变量引起情况下,还能判断出是哪一个变量引起的异方差的异方差32Heteroscedasticity Modifications•1)模型变换法)模型变换法•模型变换法的关键是事先对异方差2i = 2 f( xi )的形式有一个合理的假设•实际处理异方差,f(xi)的常用形式33•2)加权最小二乘法的思路加权最小二乘法的思路 (Check proc model with weight statement in ets module).•根据误差最小建立起来的OLS法,同方差下,将各个样本点提供的残差一视同仁是符合情理的各个ei提供信息的重要程度是一致的但在异方差下,离散程度大的ei对应的回归直线的位置很不精确,拟合直线时理应不太重视它们提供的信息即Xi对应的ei偏离大的所提供的信息贡献应打折扣,而偏离小的所提供的信息贡献则应于重视。
因此采用权数对残差提供的信息的重要程度作一番校正,以提高估计精度这就是WLS(加权最小二乘法)的思路373).“经验解决法”•在计量经济学实践中,计量经济学家偏爱使用对数变换解决问题,往往一开始就把数据化为对数形式,再用对数形式数据来构成模型,进行回归估计与分析•这主要是因为对数形式可以减少异方差和自相关的程度39对数变换的效果对数变换的效果——减少差异减少差异Log 10=1Log 100=2Log 1000=340•4)White-adjusted Statistics.41•Autocorrelation(自相关)(自相关)42•自相关的后果自相关的后果•自相关的检验自相关的检验•克服自相关的方法克服自相关的方法43自相关的后果•原因:自相关经常出现在以时间序列为样本的模型中,原因在于大多数经济时间数据都有一个明显的特点:惯性惯性•后果:后果:•1)参数估计量仍然具有一致性参数估计量仍然具有一致性44 2)变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立 其他检验也是如此。
453))模型的预测失效 区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低 所以,当模型出现自相关时,它的预,当模型出现自相关时,它的预测功能失效测功能失效46然然后后,通过分析这些“近近似似估估计计量量”之间的相关性,以判断随机误差项是否具有自相关 自相关自相关检验方法有多种,但基本思路相同:自相关检验自相关检验471)回归检验法 ………… 48如果存在某一种函数形式,使得方程显著成立,则说明原模型存在自相关 回归检验法回归检验法的优点优点是:(1)能够确定序列相关的形式,(2)适用于任何类型自相关问题的检验492)杜宾—瓦尔森(Durbin-Watson)检验法 D-W检验是杜宾(J.Durbin)和瓦尔森(G.S. Watson)于1951年提出的一种检验序列自相关的方法该方法的假定条件是:该方法的假定条件是:随机误差项i为一阶自回归形式: i=i-1+i50针对原假设:H0: =0, 构如下造统计量: D.W. 统计量量:51 D.W检验步步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断 若 0 左右时,模型不存在一阶自相关53 证明:明: 展开D.W.统计量: (*)54如果存在如果存在完全一完全一阶正相关正相关,即,即 =1,,则 D.W. 0 完全一完全一阶负相关相关,即,即 = -1, 则 D.W. 4 完全不相关完全不相关,, 即即 =0,,则 D.W. 2这里,为一阶自回归模型 i=i-1+i 的参数估计55Autocorrelation Modifications1). Generalized Difference Model (广义差分模型)2). Newey-West Standard Error Adjust561. 广义差分模型广广义义差差分分模模型型是将原模型变换为满足OLS法的差分模型,再进行OLS估计如果原模型 存在57可以将原模型变换为: 该模型为广义差分模型广义差分模型,不存在序列相关问题可进行OLS估计 )()1 (1111111011ltlttlltlttXXXYYY-------+---=---LLLtlktlktktkXXX+---++--)(11LL58广义差分模型广义差分模型: : 科克伦科克伦- -奥科特迭代法奥科特迭代法 以一元线性模型为例: 首先首先,采用OLS法估计原模型 Yi=0+1Xi+i 得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式 i=1i-1+2i-2+Li-L+i5960求出i新的“近拟估计值”, 并以之作为样本观测值,再次估计: i=1i-1+2i-2+Li-L+i61 类似地,可进行第三次、第四次迭代。 关于迭代的次数,可根据具体的问题来定 一般是事先给出一个精度,当相邻两次1,2, ,L的估计值之差小于这一精度时,迭代终止 实践中,有时只要迭代两次,就可得到较满意的结果两次迭代过程也被称为科克伦科克伦—奥科特两步法奥科特两步法62Normality•KurtosisØKurtosis=0 与正态分布的陡缓程度相同Kurtosis>0 比正态分布的高峰更加陡峭——尖顶峰Kurtosis<0 比正态分布的高峰来得平台——平顶峰•Skewness ØSkewness=0 分布形态与正态分布偏度相同Skewness>0 正偏差数值较大,为正偏或右偏长尾巴拖在右边Skewness<0 负偏差数值较大,为负偏或左偏长尾巴拖在左边 Kurtosis= 63•Skewness= •| Skewness| 越大,分布形态偏移程度越大•Solutions:ØNon-Parameter testsØRank RegressionØData Transform64Sample Selection•理论上讲,最低样本量>自变量个数+3。 否则给出下列提示信息:“数据量太少,不能完成回归模型的构建•但经验上来讲,越大越好,至少应该是自变量个数的5倍。
