好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

stata命令总结.doc

7页
  • 卖家[上传人]:cl****1
  • 文档编号:379271506
  • 上传时间:2023-01-03
  • 文档格式:DOC
  • 文档大小:24.51KB
  • / 7 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • stata11常用命令注:JB统计量对应的p大于0.05,则表明非正态,这点跟sktest和swilk检验刚好相反;dta为数据文件;gph为图文件;do为程序文件;注意stata要区别大小写;不得用作用户变量名:_all _n _N _skip _b _coef _cons _pi _pred _rc _weight doublefloat long int in if using with命令:读入数据一种方式input  x  y1          4 2        5.5 3        6.2 4        7.7 5        8.5 endsu/summarise/sum x 或 su/summarise/sum x,d对分组的描述:sort groupby group:su x%%%%%tabstat economy,stats(max)  %返回变量economy的最大值%%stats括号里可以是:mean,count(非缺失观测值个数),sum(总和),max,min,range,%%      sd,var,cv(变易系数=标准差/均值),skewness,kurtosis,median,p1(1%分位%%      数,类似地有p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 – p25)_all %描述全部_N 数据库中观察值的总个数。

      n 当前观察值的位置pi 圆周率π的数值listgen/generate %产生数列egen wagemax=max(wage)clearuseby(分组变量)set more 1/0count %计数gsort +x  (升序)gsort -x  (降序)sort x     升序;并且其它变量顺序会跟着改变label var y "消费"  %添加标签describe %描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)replace x5=2*y if x!=3 %替换变量值replace age = 25 in 107  %令第107个观测中age为25rename y2 u  %改变变量名drop in 2  %删除全部变量的第2行drop if x==. 删去x为缺失值的所有记录keep if x<2  %保留小于2的数据,其余变量跟随x改变keep in 2/10  %保留第2-10个数keep x1-x5   %保留数据库中介于x1和x5间的所有变量 (包括x1和x5),其余变量删除ci x1 x2,by(group)  %算出置信区间,不过先前对group要先排序,即sort group;%by的意思逐个进行cii 12 3.816667 0.2710343, level(90)  %已知均值,方差,计算90%的置信区间cii 10 2  %obs=10,mean=2,以二项分布形式,计算置信区间centile x,centile(2.5 25 50 75 97.5)  %取分位数correlate/corr x y z  %相关系数pwcorr x y,sig   %给出原假设r=0的命令%如果变量非服从正态分布,则spearman x yregress/reg mean year %回归方程建立 reg y x,noconstant %无常数项predict meanhat    %预测拟合值predict e,residual %得到残差estat hettest  % 异方差检验dwstat   % Durbin-Watson自相关检验vif      % 方差膨胀因子logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %logit回归probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量) %probit回归tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量) %tobit回归sktest e %残差正态性检验 p>0.05则接受原假设,即服从正态分布;%% sktest是基于变量的偏度和斜度(正态分布的偏度为0,斜度为3)swilk x  %基于Shapiro-Wilk检验%%p值越小,越倾向于拒绝零假设,也就是变量越有可能不服从正态分布xi  %生成虚拟变量tabulat gender,summ(math)  %用gender指标对math进行分类,返回两类math的mean、std、freqtabulate=tab %gen f=int((shengao-164)/3)*3+164 组距为3tabulate 变量名 [, generate(新变量) missing nofreq nolabel plot ]%%%%%generate(新变量) // 按分组变量产生哑变量nofreq           // 不显示频数nolabel          // 不显示数值标记plot             // 显示各组频数图示missing          // 包含缺失值cell             // 显示各小组的构成比(小组之和为 1)column           // 按栏显示各组之构成(各栏总计为 1)row              // 按行显示各组之构成(各行总计为 1)%%%%%求和,求最小?mod(x,y) %求余数means %返回三种平均值di normprob(1.96)di invnorm(0.05)di binomial(20,5,0.5)di invbinomial(20,5,0.5)di tprob(10,2)di invt()di fprob(3,27,1)di invfprob(3,27,0.05)di chi2(3,5)di invchi2(3,0.05)stack x y z,into(e)  %把三列合成一列xpose,clear          %矩阵转置append using d:\0917.dta  %把已打开的文件(x y z)跟0917里的(x y z)合并,是竖向合并,即观察值合并;merge using D:\0917.dta   %把已打开的文件(x y z)跟0917里的(a b)合并,是横向合并,即变量合并;format x %9.2e  %科学记数format x %9.2f  %2位小数%产生随机数%1 产生20个在(0,1)区间上均匀分布的随机数uniform()set seed 100set obs 20gen r=uniform()list%clear                      清除内存set seed 200               设置种子数为 200set obs 20                 设置样本量为 20range no 1 20              建立编号 1 至 20gen r=uniform()            产生在(0,1)均匀分布的随机数gen group=1                设置分组变量 group 的初始值为 1sort r                     对随机数从小到大排序replace group=2 in 11/20   设置最大的 10 个随机数所对应的记录                              为第2组,即:最小的10个随机数所                              对应的记录为第1组sort no                    按照编号排序list                       显示随机分组的结果也可以list if group==1和list no if group==1%2 产生10个服从正态分布N(100,6^2)的随机数invnorm(uniform())*sigma+uclear                          清除内存set seed 200                   设置种子数为 200set obs 10                     设置样本量为 10gen x=invnorm(uniform())*6+100 产生服从 N(100,6^2)的随机数list 画图注意有些图前面要加histogram 直方图line      折线图scatter   散点图scatter y x,c(l) s(d) b2("(a)")graph twoway connected y x 连点图graph bar (sum) var2,over(var1) blabel(total) %条形图. graph bar p52 p72,by(d)  . graph bar p52 p72,over(d). graph bar p52 p72,by(d) stack. graph bar p52 p72,over(d) stack////////////数据如下%d p52 p72%1 163.2 27.4%2 72.5 83.6%3 57.2 178.2histogram x,bin(8) norm  %画直方图,加正态分数线graph pie a b o ab if area==1,plabel(_all percent) %画饼图graph pie var2, over(var1) plabel(_all percent)    %饼图graph pie p52 p72,by(d) %饼图graph box y1 %箱体图qnorm x   %图lfit y x  %回归直线graph matrix gender economy math 多变量散点图line yhat x||scatter y x,c(.l) s(O.) xline(12) yline(5.4)  %线形图&散点图有一些通用的选项可以给图形“润色”:标题 title(“string”) (string可为任意的字符串,下同)脚注 note(“string”)横座标标题 xtitle(“string”)纵座标标题 ytitle(“sting”)横座标范围 xaxis(a,b) (a

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.