
Stata 15数据管理于统计绘图软件新功能介绍.docx
19页Stata 15 数据管理于统计绘图软件新功能介绍本文由中国科学软件网翻译整理2017 年 6 月 Stata 15 正式发布这是 Stata 有史以来最大的一次版本更新我们贴出了Statalist 并且列出了 16 项最重要的新功能这篇文章会重点谈谈这些新功能: 扩展回归模型 潜在类别分析(LCA) 贝叶斯前缀指令 线性动态随机一般均衡(DSGE)模型 web 的动态 Markdown 文档 非线性混合效应模型 空间自回归模型(SAR) 区间删失参数生存时间模型 有限混合模型(FMMs) 混合 Logit 模型 非参数回归 聚类随机设计和回归模型的功率分析 Word 和 PDF 文档 图形颜色透明度/不透明度 ICD-10-CM/PCS 支持 联邦储备经济数据(FRED)支持 其他1.扩展回归模型我们称之为 ERMS 扩展回归模型四个新的命令适合. 线性回归分析,. 区间回归包括 tobit 模型,. 概率,. 有序概率模型可任意组合成:. 内生变量. 非随机处理任务. 内源性(Heckman-style)样本的选择这些新的命令让人惊喜,因为可以在任何一个方程中加入内生变量,包括处理赋值和概率选择方程。
内生变量并不局限于连续性它们可以是二进制或序数不管是外生的还是内生的,它们都可以与其他变量相互作用它们甚至可以互相作用,形成平方项或立方项!这些新的 ERM 命令—eregress, eintreg, eprobit, 和 eoprobit 注定会流行起来,因为他们解决了研究人员的很多问题首先, 可能有一个内生变量, 因为许多模型都省略了与模型中的变量相关的变量其次,数据经常被删剪,而删剪不是随机的ERM 样本选择选项允许您对选择过程进行建模, 并对其进行调整或者, 如果您正在使用非随机处理效应模型, 则可以用 ERM处理分配选项或者, 可以结合处理分配和选择选项, 其中一些是由于后续的行为而损失的拟合内生处理分配模型语法非常简单:Eregress 适合线性回归可以很容易地把概率模型拟合成线性回归模型如果结果变量 y 是二进制的,则键入:如果结果变量 y 是连续的,但变量 x2 是二进制的,则键入如果 y 和 x2 都是二进制的,则键入如果想知道奇怪的 nomain 选项的详细情况当指定 endogenous(name=…)时,变量 name会自动添加到主方程中可以键入或者无论哪种方式,相同的模型都是可以的。
在前面的例子中指定了 nomain,所以我不需要解释包括主方程 X2 的这个选项2.潜在类别分析(LCA)潜在的均值未被观测分类也就是分组潜在类是数据中未观测到的组你可能有关于消费者的数据,并且根据消费者对产品的潜在兴趣将他们分成三组但是,在数据中没有指定每个消费者所属组的变量如果有四个二进制变量,它们是消费者所属的潜在类的指示信号,可以键入y1, y2, y3, 和 y4 被观测Consum 是潜在的分类变量,lclass(Consum 3)指定为 3 这个值其结果是拟合一个模型, 其中 y1、y2、y3 和 y4 是由未观测的类确定四 y 变量中一个和三类中的一类,命令适合 4×3 = 12 逻辑回归分析每个回归都有一个截距此外,多项逻辑回归也可以用来预测 Consum拟合模型后,你可以. 使用新的 estat lcprob 命令估计属于每一类的消费者比例;. 使用新的 estat lcprob 命令估计每个类中 Y1、Y2、Y3 、Y4 的边际均值(均值就是示例所示的概率);. 使用新 estat lcprob 命令来评价适合度;. 使用现有的 predict 命令获取分类成员的预测概率和观测结果变量的预测值。
3.贝叶斯前缀指令新的 bayes:前缀命令使你能够适应比以前版本更广泛的贝叶斯模型原来也可以拟合贝叶斯线性回归, 但是现在可以通过输入文字就可以:这非常方便以前不能做拟合贝叶斯生存的模型现在可以:甚至可以拟合贝叶斯多级生存模型:在这个模型中, 为变量 id 的每个值添加随机截距新的 bayes:前缀命令在许多 Stata 评估命令之前工作,并提供超过 50 种可能性的模型支持的模型包括多级、面板数据、生存和样本选择模型!新命令支持所有 Stata 的贝叶斯的功能你可以从之前的模型参数的分布中选择,也可以使用之前默认的当闭合形式解决方案用于 Gibbs 方法时,可以使用默认的自适应 Metropolis–Hastings 抽样, 或 Gibbs 抽样 , 或两种方法的组合在 bayesmh 命令的基础上可以使用STATA 的任何其他功能可以更改回归系数的缺省先验分布,比如,使用 prior()选项:评估后,可以使用 Stata 标准贝叶斯 postestimation 工具,比如. bayesgraph 检查收敛性. bayesstats summary 估计模型参数的功能. bayesstats ic 和 bayestest model 计算贝叶斯因子并比较贝叶斯模型. bayestest interval 进行区间假设检验4. 线性动态随机一般均衡(DSGE)模型DSGEs 是经济学中的一个时间序列模型。
它们是传统预测模型的替代品两者都试图解释总的经济现象, 但 DSGEs 允许对来自经济理论模型的基础上做这个建立在经济理论基础上的方程很多这些方程的关键特征是, 未来变量的期望值会影响今天的变量这是区别 DSGEs 与矢量回归或状态空间模型的一个特性另一个特点是, 从理论推导出来的参数通常可以用这个理论来解释 这里是如何在 Stata 中拟合一个双方程 DSGE 模型大括号, {}, 用于把参数括起来:p 是一个控制变量, 而 y 是状态空间术语中的状态变量f. 是正向运算符第一个方程式,表示控制变量 p 取决于未来的{beta}*p 加上现在的{kappa}*y 第二个方程式,表示 y 的预期未来值是现在的 {rho}*ystata 选项指定 y 是一个状态变量在 DSGE 模型中有三种变量:. 控制变量和方程,如 p 没有冲击,并且是由方程组决定的 状态变量 (如 y) 具有隐含的冲击, 在时间段开始时是预先确定的 冲击是驱动系统的随机错误在任何情况下, 以上 dsge 命令可以定义一个模型并拟合如果我们有一个关于 beta 和 kappa 之间关系的理论, 比如它们是相等的, 我们可以用现有的命令 test 来测试它。
新的 postestimation 命令 estat policy 和 estat transition 报告策略和转换矩阵如果键入显示将控制变量作为状态变量的线性函数如果有五个控制变量和三个状态变量, 则每个控件将被报告为三个状态的线性函数在上面的简单例子中, 预测 p 的线性函数将显示为现在的 y 函数同时,报告转换矩阵而策略矩阵将 p 报告为函数 y, 而转换矩阵则报告 y 如何通过时间演变为p可以使用 Stata 的现有预测命令来生成预测可以使用 Stata 现有的 irf 命令来绘制脉冲响应函数这是一个脉冲响应图:5. web 动态的 Markdown 文档你有没有听过 Markdown?它是一种创建 html 文档的流行方式html 文件是繁琐的Markdown 简单直观,想法很简单可以创建一个文件 , 其中包含所需的可读格式的文本, 然后通过它运行一个命令来创建一个 HTML 文件Stata 现在支持 Markdown, 我们已经添加了标签 (功能) 到 Markdown, 允许包括输入文件中的 Stata 命令你所包含的命令将被运行和显示 , 或者以秘密方式运行 , 以及提取输出的部分供文档使用。
您可以创建一个文件,例如在 Stata 中,你可以输入现在, 有了一个名为 example.html 的新文件, 在 web 上, 看起来像这样:dyndoc 代表动态文档创建的 Markdown 文件是动态的, 如果数据发生变化, 你可以通过简单的输入重新创建网页6. 非线性混合效应模型非线性混合效应模型也被称为非线性多级模型和非线性层次模型可以用两种方式来考虑这些模型可以把它们看成包含随机效应的非线性模型或者可以把它们看成线性混合效应模型, 其中一些或所有的固定和随机效应都是非线性的不管哪种方式, 总的误差分布假设成Gaussian 分布这些模型在人口药代动力学, 生物鉴定和研究生物学和农业成长过程中很流行比如,采用非线性混合效应模型对机体的药物吸收、地震强度和植物生长进行了模拟新的评估命令被命名为 menl它实现了 popular-in-practice Lindstrom–Bates 算法, 是基于对固定和随机效应的非线性均值函数进行线性化支持最大似然和受限最大似然估计方法Menl 易于使用可以直接输入单个方程大括号{ },用于将要匹配的参数括起来:估值是 b1, b2, 和 b3。
U[plant]是每个 plant 的随机截距menl 可以拟合多级或多层次的规范,其中参数将每个层级定义为模型参数和随机效应函数这个和上一个模型是一样的,此外,b2 和 b3 允许在不同的 plant 间变化几个方差-协方差结构可用于在同一个层级上对随机效应的相依性进行建模如果你想建模的话,可以把上面例子中的相依性设在 U1,U2 和 U3 之间虽然没有明确说明,在这个模型中存在一个组内错误方差协方差结构灵活应用于异方差和组内相关性的建模异方差可以建模为一个协变量或预测平均值的幂函数,相依性可以使用任意阶的自回归模型进行建模除了标准功能外, postestimation 特征还包括对随机效应及其标准误差的预测,对模型中定义的感兴趣参数的预测, 作为其他模型参数和随机效应的参数、聚类相关矩阵的整体评估等7. 空间自回归模型(SAR)Stata 适合空间自回归 (SAR) 模型, 也称为同步自回归模型新的 spregress, spivregress, 和 spxtregress 命令允许因变量的空间滞后、自变量的空间滞后和空间自回归误差空间滞后是时间序列滞后的空间模拟时间序列滞后近年来成为变量值。
空间滞后是附近地区的值该模型适用于区域数据, 也称为区域性数据观测结果被称为空间单位 , 可以是国家、州、区、县、市、邮政编码或城市街区,或者它们可能根本就不是地理位置它们可能是社交网络的节点空间模型评估直接影响—区域对自身的影响,并估算邻近地区的间接或溢出效应有一个全新的 [SP] 手册专门介绍 Stata 的新 SAR 功能这些命令被称为 Sp 命令它们可以与以下一起工作: shapefiles 通过 web 获取你选择数据,或者 没有 shapefiles 和数据,只包含位置的坐标,或者 没有 shapefiles 没有位置会出现社会网络数据下面是它如何与 shapefiles 一起工作的访问了美国人口普查局网站并下载tl_2016_us_county 文件你现在键入下一步,将新创建的 tl_2016_us.county.dta 文件与你的分析文件合并:您已经准备好定义空间加权矩阵和拟合空间滞后模型只拟合 (1) college (2)的依赖变量的空间滞后和(3) college 空间滞后的 unemployment 模型该模型也有自回归误差空间滞后变量采用 W 计算,空间滞后误差采用 m 计算。
8. 区间删失参数生存时间模型Stata 新的 stintreg 命令加入 streg, 用于拟合参数生存模型 stintreg 拟合区间删失数据模型在区间删失数。
