好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

倾向值匹配法(PSM).ppt

45页
  • 卖家[上传人]:新**
  • 文档编号:589768353
  • 上传时间:2024-09-11
  • 文档格式:PPT
  • 文档大小:539KB
  • / 45 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 倾向值匹配法(PSM) Q:为什么要使用PSM?nA:解决样本选择偏误带来的内生性问题n例:上北大有助于提高收入吗?n样本选择偏误:考上北大的孩子本身就很出色(聪明、有毅力、能力强…)n解决方法:样本配对 配对方法n同行业(一维配对)n同行业、规模相当(二维配对)n同行业、规模相当、股权结构相当、……(多维配对)???nPSM:把多个维度的信息浓缩成一个(降维:多维到一维) 配对过程中的两个核心问题(1)nQ1:哪个样本更好一些?A1:Sample2较好:比较容易满足共同支撑假设(common support assumption) 配对过程中的两个核心问题(2)nQ2:stu c1,c2,c3三人中,谁是stu PK的最佳配对对象?nA2:stu c3是最佳配对对象,比较容易满足平行假设(balancing assumption) ATT(Average Treatment Effect on the Treated)平均处理效应的衡量n运用得分进行样本匹配并比较,估计出ATT值nATT=E[Y(1)-Y(0) |T=1]Y(1):Stu PK 上北大后的年薪Y(0): Stu PK 假如不上北大的年薪可观测数据可观测数据不可观测数据,不可观测数据,采用配对者的采用配对者的收入来代替收入来代替ATT=12W-9W=3W 实例介绍 实例介绍n研究问题:培训对工资的效应n基本思想:分析接受培训行为与不接受培训行为在工资表现上的差异。

      但是,现实可以观测到的可以观测到的是处理组接受培训的事实,而如果处理组没有接受培训会怎么样是不可观测的不可观测的,这种状态称为反事实匹配法就是为了解决这种不可观测的事实的方法 实例介绍n分组:在倾向值匹配法中,根据处理指示变量将样本分为两个组处理组处理组,在本例中就是在NSW(国家支持工作示范项目)实施后接受培训的组;控制组控制组,在本例中就是在NSW实施后不接受培训的组n研究目的:通过对处理组和对照组的匹配,在其他条件完全相同的情况下,通过接受培训的组(处理组)与不接受培训的组(控制组)在工资表现上的差异来判断接受培训的行为与工资之间的因果关系 变量定义 变量定义 倾向打分 OLS回归结果工资的变化到底是来自个体的异质性工资的变化到底是来自个体的异质性性还是培训?性还是培训? 倾向打分n1.设定宏变量(1)设定宏变量breps表示重复抽样200次命令:global breps 200(2)设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 倾向打分n2.通过logit模型进行倾向打分命令:pscore treat $x,pscore(mypscore) blockid(myblock) comsup numblo(5) level(0.05) logit注:$表示引用宏变量 pscore结果 倾向值分布 倾向值分布 block中样本的分布 block中的描述性统计 运用得分进行样本匹配并比较 方法一:最邻近方法方法一:最邻近方法((nearest neighbor matching))n含义:最邻近匹配法是最常用的一种匹配方法,它把控制组中找到的与处理组个体倾向得分差异最小的个体,作为自己的比较对象 。

      n优点:按处理个体找控制个体,所有处理个体都会配对成功,处理组的信息得以充分使用n缺点:由于不舍弃任何一个处理组,很可能有些配对组的倾向得分差距很大,也将其配对,导致配对质量不高,而处理效应ATT的结果中也会包含这一差距,使得ATT精确度下降 方法一:最邻近方法方法一:最邻近方法((nearest neighbor matching))n命令nset seed 10101(产生随机数种子)nattnd re78 treat $x,comsup boot reps($breps) dots logit 方法一:最邻近方法方法一:最邻近方法((nearest neighbor matching)) 方法二:半径匹配法方法二:半径匹配法((radius matching))n半径匹配法是事先设定半径,找到所有设定半径范围内的单位圆中的控制样本,半径取值为正随着半径的降低,匹配的要求越来越严 方法二:半径匹配法方法二:半径匹配法((radius matching))n命令n set seed 10101n attr re78 treat $x,comsup boot reps($breps) dots logit radius(0.001) 方法二:半径匹配法方法二:半径匹配法((radius matching)) 方法三:分层匹配法方法三:分层匹配法((stratification matching))n内容:分层匹配法是根据估计的倾向得分将全部样本分块,使得每块的平均倾向得分在处理组和控制组中相等。

      n优点:Cochrane ,Chambers(1965)指出五个区就可以消除95%的与协变量相关的偏差这个方法考虑到了样本的分层问题或聚类问题就是假定:每一层内的个体样本具有相关性,而各层之间的样本不具有相关性n缺点:如果在每个区内找不到对照个体,那么这类个体的信息,会丢弃不用总体配对的数量减少 方法三:分层匹配法方法三:分层匹配法((stratification matching))n命令nset seed 10101natts re78 treat,pscore(mypscore) blockid(myblock) comsup boot reps($breps) dots 方法三:分层匹配法方法三:分层匹配法((stratification matching)) 方法四:核匹配法方法四:核匹配法((kernel matching))n核匹配是构造一个虚拟对象来匹配处理组,构造的原则是对现有的控制变量做权重平均,权重的取值与处理组、控制组PS值差距呈反向相关关系 方法四:核匹配法方法四:核匹配法((kernel matching))n命令nset seed 10101nattk re78 treat $x,comsup boot reps($breps) dots logit 方法四:核匹配法方法四:核匹配法((kernel matching)) psmatch2 匹配变量的筛选n1.设定宏变量设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black 匹配变量的筛选n2.初步设定nlogit treat $x 匹配变量的筛选n3.逐步回归nstepwise,pr(0.1):logit treat $x ps值的计算npsmatch2 treat $x,out(re78)n倾向得分的含义是,在给定X的情况下,样本处理的概率值。

      利用logit模型估计样本处理的概率值概率表示如下:nP(x)=Pr[D=1|X]=E[D|X] 匹配处理组n最近邻匹配n命令:psmatch2 treat $x(if soe==1),out(re78) neighbor(2) aten半径匹配n命令:psmatch2 treat $x,out(re78) ate radius caliper(0.01)n核匹配n命令:psmatch2 treat $x,out(re78) ate kernel 匹配处理组n满足两个假设:A共同支撑假设B平行假设 ATT(平均处理效应的衡量)以半径匹配为例:psmatch2 treat $x,out(re78) ate radius caliper(0.01)1231、处理组平均效应(、处理组平均效应(ATT))2、控制组平均效应(、控制组平均效应(ATU))3、总体平均效应(、总体平均效应(ATE)) ATT(平均处理效应的衡量)n匹配前后变量的差异对比n命令:pstest re78 $x(pstest re78 $x,both graph) 匹配前后密度函数图twoway (kdensity _ps if _treat==1, legend(label(1 "Treat"))) (kdensity _ps if (_wei!=1&_wei!=.), legend(label(2 "Control"))), xtitle("Pscore") title("After Matching")twoway (kdensity _ps if _treat==1, legend(label(1 "Treat"))) (kdensity _ps if _treat==0, legend(label(2 "Control"))),xtitle(Pscore) title("Before Matching") 运用bootstrap获得ATT标准误n命令:bootstrap,reps(#):psmatch2 treat $x,out( re78)n在统计分析中,样本较少,采用bootstrap,可以减少小样本偏误。

      n步骤:首先,从原始样本中可重复地随机抽取n个观察值,得到经验样本;然后采用PSM计算改经验样本的平均处理效果ATT;将第一步和第二步重复进行#次,得出#个ATT值;计算#个ATT值的标准差 核匹配的Bootstrap检验 。

      点击阅读更多内容
      相关文档
      【全国硕士研究生入学统一考试政治】2020年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2015年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2010年考研政治真题.docx 【全国硕士研究生入学统一考试政治】1996年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2001年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2016年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2000年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(理科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2007年考研政治真题.doc 【全国硕士研究生入学统一考试政治】1997年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2004年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2003年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2019年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2009年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2001年政治考研真题(文科)及参考答案.doc 【全国硕士研究生入学统一考试政治】2021年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2014年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2018年考研政治真题.docx 【全国硕士研究生入学统一考试政治】2008年考研政治真题.doc 【全国硕士研究生入学统一考试政治】2011年考研政治真题.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.