电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

Stata统计分析命令..

12页
  • 卖家[上传人]:汽***
  • 文档编号:484088635
  • 上传时间:2023-07-06
  • 文档格式:DOCX
  • 文档大小:44.48KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、Stata 统计分析常用命令汇总一、winsorize极端值处理范围:一般在 1%和 99%分位做极端值处理,对于小于 1%的数用 1%的值赋值,对于大于 99% 的数用 99%的值赋值。1、Stata 中的单变量极端值处理:stata 11.0,在命令窗口输入“findit winsor”后,系统弹出一个窗口,安装winsor模块 安装好模块之后,就可以调用winsor命令,命令格式:winsor varl, gen(new var) p(0.01) 或者在命令窗口中输入:ssc install winsor安装winsor命令。winsor命令不能进行批量处 理。2、批量进行 winsorize 极端值处理:打开链接:http:/personal.anderson.ucla.edu/judson.caskey/data.html 找至U winsorizeJ,点击 右键,另存为到stata中的ado/plus/目录下即可。命令格式:winsorizeJ var1var2var3,suffix(w) 即可,这样会生成三个新变量,var1w var2w var3w,而且默认的是上下1%

      2、winsorize。如果 要修改分位点,则写成如下格式: winsorizeJ var 1 var2 var3,suffix(w) cuts(5 95。3、Excel中的极端值处理:(略) winsor2 命令使用说明简介: winsor2 winsorize or trim (if trim option is specified) the variables in varlist at particular percentiles specified by option cuts(# #). In defult, new variables will be generated with a suffix _w or _tr, which can be changed by specifying suffix() option. The replace option replaces the variables with their winsorized or trimmed ones.相比于 winsor 命令的改进:(1) 可以批量处理多个变量;(2) 不仅可以 winsor,也

      3、可以trimming;(3) 附加了 by() 选项,可以分组 winsor 或 trimming;(4) 增加了 replace 选项,可以不必生成新变量,直接替换原变量。范例:*- winsor at (p1 p99), get new variable wage_w. sysuse nlsw88, clear. winsor2 wage*- left-trimming at 2th percentile. winsor2 wage, cuts(2 100) trim*- winsor variables by (industry south), overwrite the old variables. winsor2 wage hours, replace by(industry south)使用方法:1. 请将 winsor2.ado 和 winsor2.sthlp 放置于 stata12adobasew 文件夹下2. 输入 help winsor2 可以查看帮助文件;二、描述性统计1、summarize命令格式:su、sum 或者 summarize varlist if i

      4、n weight options如果 summarize 或 sum 后不加任何变量,则默认对数据中的所有变量进行描述统计 options 选项: detail 表示产生更加详细的统计变量Separator (n)表示每n个变量画一条分界线,n=0表示禁止使用分界线Summarize 描述统计输出表中包含:样本容量、平均数、标准差、最小值和最大值2、tabstat命令格式: tabstat varlist if in weight ,optionsoptions 选项: stat(statname) 表示设定所需要的统计量col(stat)或c表示将结果报表转置统计量:mean:平均数count/n:观测值数目sum:加总max/min :最大值/最小值range :极差sd:标准差cv:变异系数semean :平均标准误差skewness:偏度var :方差kurtosis :峰度median/p50:中位数p# : #%百分位数例如:tabstatvarlist,stat(count mean sd median min max range) col(stat)3、描述性统计结果输

      5、出到 word 或 Excel用 sum 做的描述性统计:logout, save(miaoshutongji) word replace:sum用 tabstat 做 的 描 述 性 统 计 : logout, save(miaoshutongji) word replace:tabstatvarlist ,stat(count mean sd median min max range) col(stat)分组描述:bysort var:三、相关性分析(一) 相关性分析1、Pearson 相关系数命令格式:correlate (简写:cor 或 corr)varlist if in weight ,options2、spearman 相关系数命令格式:spearmanvarlist, stats(rho p)3、在Stata中,命令corr用于计算一组变量间的协方差或相关系数矩阵;4、命令pwcorr可用于计算一组变量中两两变量的相关系数,同时还可以对相关系数的显著性进行检验;option选项中加上sig可显示显著性水平:pwcorrvarlist ,sig5、命令 pcorr 用于

      6、计算一组变量中两两变量的偏相关系数并进行显著性检验。6、Spearman 和 Pearson 检验同在一个表的命令: corrtblvarlist ,corrvars (varlist)输出结果中,上三角为Spearman相关系数和显著水平,下三角为Pearson系数和显著水平。(二) 输出相关系数表到 word 或 Excel 中例如: logout, save(mytable) word replace: pwcorr_a price mpg rep78 headroom trunk, star1(0.01) star5(0.05) star10(0.1)四、截面数据单方程线性回归模型的Stata实现命令格式:regress (简写:reg)depvar indepvars if in weigh option( depvar 表示因变量, indepvars 表示自变量)五、异方差的检验与处理1、检验异方差命令格式:hettest2、判断异方差的标准:.hettestErcusch-Pagan / cook-wen sber g test for heteroskedasfici

      7、tyHo: constant vari ancqvarl abl es : fitted val lies of Lpfmschi2(l)=0.55Prob ch-i 2 =0.4584看 P 值的大小来判断,如果 P 值小于 0.05,则不能排除异方差的可能,上图中 P 值等于 0.45840.05,因此,可以排除异方差的可能性。3、处理异方差命令格式:在reg命令后加上“,r”或者“jobust”即可。经异方差处理后的 回归不显示调整后的R2 (adj-R2),如果要查看调整后的R2,再输入命令:di e(r2_a)六、多重共线性(自变量之间高度相关)命令格式: vif(一) 判断多重共线性的标准(两个标准必须同时满足):1、最大的 vif 大于 10;2、平均的 vif 大于 1 。(二) 多重共线性的修正1、采用逐步回归进行修正,命令格式: sw reg depvar indepvar, pr(0.05)2、对于含二次项的,使用“对中”的方法,既可以保留二次项,又可以在一定程度上克服 多重共线性的问题:先定义两个变量,分别为该变量减去其均值和该变量的平方,命令如下: sum v

      8、argen var1=var-r(mean)gen var2=varA2再用新变量代替原来的变量进行回归处理七、内生性的检验与处理(内生性是指自变量与误差项之间有关系)1、内生性的检验: ovtest-ovtestRamsey RESET test usnng power5 of the fitted value5 of Lpfm5ho: model has no omlizrecl variablesf(3! 379) =0.S4Prob F =0.4717看P值的大小来判断,如果P值小于0.05,则不能排除内生性的可能,上图中P值等于 0.47170.05,因此,可以排除内生性的可能。2、内生性的处理:使用工具变量法: ivreg内生性的三个来源:测量误差、遗漏变量和双向因果。1、变量的内生性。这个是没有办法单独检验的。当有合适工具变量时候,是可以检验的,就是hausman检验2、工具变量的外生性。这个也是没办法检验的。当有很多工具变量时候,可以检验是否有不是外生的,就是“过度 识别”问题3、工具变量的相关性。这个可以说成是“弱工具变量”问题,检验可以通过一阶段的F值。还可以利用P

      9、artial R2。4、估计方法stata里面有这么几个2sls, 2sls smal、liml、gmm,各自适用情况:small适合小样本;liml 适合弱工具变量;gmm适合异方差。【例子】webuse hsng2*Fit a regression via 2SLS, requesting small-sample statisticsivregress 2sls rent pcturban (hsngval = faminc iregion), small*Fit a regression using the LIML estimatorivregress liml rent pcturban (hsngval = faminc iregion)*Fit a regression via GMM using the default heteroskedasticity-robust weight matrixivregress gmm rent pcturban (hsngval = faminc iregion)*Fit a regression via GMM using a heteroskedasticity-robust weight matrix, requesting nonrobust standard errorsivregress gmm rent pcturban (hsngval = faminc iregion), vce(unadjusted)*检验estata firststage ,al

      《Stata统计分析命令..》由会员汽***分享,可在线阅读,更多相关《Stata统计分析命令..》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.