好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

中国工业企业数据库与Stata简介.ppt

49页
  • 卖家[上传人]:n****
  • 文档编号:56698391
  • 上传时间:2018-10-15
  • 文档格式:PPT
  • 文档大小:638KB
  • / 49 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 宏观经济分析与政策模拟讨论班,中国工业企业数据库与Stata简介,,1、中国工业企业数据库介绍 2、数据格式转换——Stat-Transfer软件介绍 3、Stata12介绍 4、Stata操作实例,主 要 内 容,1.数据库介绍,中国工业企业数据库来源于国家统计局数据库的统计对象为规模以上工业企业,包括全部国有工业企业和年主营业务收入 500 万元及以上的非国有工业企业,与《中国统计年鉴》的工业部分和《中国工业统计年鉴》的覆盖范围一致区别是工业企业数据库是企业层面的原始数据,而“年鉴”是按不同维度得到的加总数据截止 2011 年,数据库共收录了 58 万多家工业企业,占工业总产值的95%左右,覆盖了中国工业40多个大类、90多个中类、600多个小类,每个企业提供超过上百个变量,是目前国内最为全面和权威的企业层面数据该数据库是我国经济学和管理学研究领域的重要资料,利用该数据库已有很多学者做出了非常有价值的研究成果受数据取得难度的限制,拥有该数据库的研究机构在国内还并不多,因此该数据库在研究领域有广阔的应用前景1.数据库介绍,1.数据库介绍,数据库里的企业用“法人代码”(FRDM)作为标志。

      数据库覆盖的企业不会一成不变,每年都有新增企业和减少企业,绝大部分企业的资料是连续的尽管原则上每个企业的法人代码不会改变,在极少数情况下,企业会改换企业名称或法人代码数据库从1995年开始,最近更新到2011年1.数据库介绍,数据库对每个企业给出两类信息,一是企业经营成果有关的信息,包括资金流量表、资产负债表和损益表的主要信息,以及雇用员工和生产活动信息;二是对企业身份、生产经营活动内容和状态进行定性描述的信息,以代码的形式出现,在使用时需要使用参照代码表2.Stat-Transfer介绍,Transfer软件专用于转换不同格式的数据文件,Access 数据通过 Transfer软件可转换为 Stata 格式的数据 (1)数据转换( Transfer)选项卡 (2)变量选择( Variables)选项卡 (3)记录选择( Observations)选项卡 (4)其他选项( Option)选项卡,,在Transfer这个界面上,通过几个下拉式菜单,选择需要转换数据库的源文件和目标文件的类型、名称,点击转换(Transfer) 就可实现数据间的简单转换软件支持的数据类型包括我们常用的SAS、SPSS、STATA、S-Plus、Excel、Epi Info等等。

      如果在转换数据时,只对其中的一部分观察值感兴趣, 可以利用 “变量选择”或者 “记录选择”,进行部分数据转换2.Stat-Transfer介绍,在变量选择上,可选择全部变量,亦可选择部分变量,同时还可在转换中重新设置变量输出的数据类型,如浮点型(float),日期型(date),时间型(time),字符型(string) 等软件还支持优化(Optimize)功能;Use Doubles选项在转换时可将有小数位的变量设置成双精度型 (double),保证数据的精度;Drop Constants选项,则自动将变量值恒为常数或缺失值的变量略去,这在数据繁多时特别能体现出其优越性2.Stat-Transfer介绍,在记录选择上,可选择全部记录,亦可选择部分记录这一部分的记录选取,用户可以通过条件限定来实现如:要求Variable1的值大于300或者Variable2的值为偶数,在选项卡的文本框中输入相应的约束条件:where Variable1> 300,或者 where Variable2%2=0还可以利用软件自带的函数来实现一些较复杂的数据选取,例如,按20%比例进行简单随机抽样(where samp_rand(0.2)),按10%比例进行系统抽样(间隔抽样) (where samp_syst(10))。

      2.Stat-Transfer介绍,,Transfer软件还提供了一些其它的功能, 如在转换过程中更换变量名,自动运行变量输出类型的优化功能,设置日期时间型数据的读写格式,对缺失值的各种处理方式的设定,随机种子的产生或设定,设置文本格式文件的读取格式,Excel工作簿中工作表的选取,覆盖文件前确认提示等其它功能2.Stat-Transfer介绍,,3.Stata12 介绍,Stata软件是现今较为流行的统计计量分析软件,具有强大的数据处理和分析功能,且操作简单、使用灵活、易学易用、运行速度极快Stata的另一个特点是它的许多高级统计模块均是编程人员用宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载 安装好 Stata 后,点击电脑桌面上的Stata 图标,即可打开Stata此时可以看到,在最上方有一排菜单,即“File Edit Data Graphics Statistics User Window Help”在此之下,有五个窗口,分别为:,,左上 “Review”(历史窗口):记录着自启动Stata以来的命令 右上“Variables”(变量窗口):记录着Stata 内存中的所有变量。

      右下“Properties”(性质窗口):显示当前数据文件与变量的性质 中上“Results”(结果窗口):显示执行Stata 命令后的输出结果 中下“Command”(命令窗口):在此窗口输入Stata 命令3.寻求帮助与网络资源,通过多种途径可以获得 Stata 的帮助,主要的途径有三个:手册、 Stata 自带帮助和网络帮助 Stata手册是一本学习Stata使用的权威书籍,它按字母顺序排列出了Stata所有相关的命令 Stata的自带帮助系统是使用最方便,也是最常用的方法 ,我们可以在记住极少量基本命令的基础上,方便地运用Stata命令3.help和search,Stata自带帮助系统: help 显示出Stata所有帮助内容的目录结构比如想了解regress的用法,可在Stata Command中输入如下语句:help regress Stata会提供关于regress用法的详细说明,并配以例子3.help和search,网络帮助可以采用如下命令获得findit scat3search scat3这两条命令等价,均为寻找绘三维立体图的命令scat3由于scat3不是Stata内置命令,所以需要通过这两个命令搜索并下载安装后才能使用。

      区别:help用于查找精确的命令名,search是模糊查找,findit与search命令类似,但其可以进一步搜索网络上的信息3.几个主要的网站,,(1) STATA公司官方网站 (2) STATA资源链接 (3) STATA出版社http://www.stata- (4) STATA电子杂志http://www.stata- (5) STATA技术公告版 http://fmwww.bc.edu/gstat/docs/gsafaq.html http://www.ats.ucla.edu/stat/stata/examples/default.html,,,4、Stata操作与实例,4.1 Stata 的日志 4.2 do文件 4.3 数据导入 4.4 变量的生成与处理 4.5 数据的合并 4.6 数据类型转换 4.7 描述统计 4.8 画图 4.9 回归分析,4.1 Stata 的日志,log文件以后缀“.log”表示,用于记录Stata的运行结果可点击菜单“File”→“Log”→“Begin”,然后输入日志(log)的文件名,并存储在指定的位置此后,在Stata中的所有操作及其输出结果,都将被记录在此日志中,直至选择退出。

      如果要暂时关闭日志(不再记录输出结果),输入命令“log off”如果要恢复使用日志,输入命令“log on”如果要彻底退出日志,输入命令“log close” 如果要查看日志文件中的内容,点击存储位置上的日志文件图标即可4.1 Stata 的日志,例: (开始运行) log using D:\Econometrics\logfiles\20150510.log …………………. (Stata命令) ………………… log close (结束运行) 从而20150510.log就记录了从“log using”命令到“log close”命令之间Stata运行的所有结果4.2 do文件,用Stata的do文件编辑器记下做过的工作:在Stata窗口上部的工具栏中有一个小按钮 ,把鼠标放上去会出现“New Do-file Editor”,点击它就会出现do文件编辑器 在do-file文件中,用*表示注释内容,Stata在运行do-file文件时会跳过这些注释语句4.3 将数据导入Stata,打开Stata 软件后,点击Data → Data Editor图标,即可打开一个类似Excel的空白表格。

      然后,用Excel打开文件,复制文件中的相关数据,并粘贴到Data Editor中 导入数据的另一方法是,点击菜单“File”→“Import”,然后导入各种格式的数据 Stata默认的数据文件扩展名为.dta,打开stata内置的auto.dta数据库,命令:use auto注意:Stata 中字母的大小写是严格区分的,因此Stata 建议对于变量名 一律使用小写字母4.3 将数据导入Stata,,use命令的基本语句,具体格式如下:use [varlist] [if] [in] using filename [, clear nolabel] 含义说明:use是打开数据的命令语句,varlist代表变量名 称,if是条件语句,in是范围语句,using filename代表数据 文件路径 (1)打开数据文件中的全部数据 如果想要打开auto数据文件中的全部数据,输入命令:use auto auto.dta美国汽车产业的横截面数据(1978年) ,变量主要包括:price=汽车的价格,mpg=每加仑油所行驶的英里数,weight=汽车的重量,foreign表示是否是进口车,如果foreign=0代表是国产车,如果foreign=1代表是进口车。

      4.3 将数据导入Stata,,(2)打开数据文件中的部分变量 有时,并不需要将数据文件中的所有变量全部打开,因为原始数据内容丰富,含有很多变量,而研究可能只涉及其中的几个变量所以若只打开auto文件中的make和price这两个变量,应该使用如下命令: use make price using auto use make price部分表示需要打开make和price两个变量,using auto部分表示打开的数据文件路径及名称4.4 变量生成与处理,(1)生成新变量 命令格式:generate newvar = exp [if exp] [in range]含义说明:newvar是生成的新变量,exp是由现有变量 生成新变量的算术或逻辑表达式,[if exp] 和[in range]指定对哪些观测计算新变量值比如:gen a = f314*f314 (新变量a等于f314的平方)gen F= f314/v210变量含义:f314固定资产净值年平均余额v210从业人员平均人数,,4.4 变量生成与处理,(2)对现有变量重新赋值 命令格式: replace oldvar = exp [if exp] [in range] 含义说明: oldvar为现有的变量。

      对满足[if exp]和[in range]的样本,oldvar将根据表达式exp重新赋值 比如:replace v211=. if v211<=0 (若工业增加值非正,令其取缺失值)replace v211=25 in 10 (令第10个观测中v211为25) gen和replace…if常常在一起使用,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.