
含虚拟自变量的回归分析.ppt
13页1 统计学上的定义和计算公式统计学上的定义和计算公式含虚拟自变量的回归分析含虚拟自变量的回归分析 定义:前面几节所讨论的回归模型中,因定义:前面几节所讨论的回归模型中,因变量和自变量都是可以直接用数字计量的,即变量和自变量都是可以直接用数字计量的,即可以获得其实际观测值(如收入、支出、产量、可以获得其实际观测值(如收入、支出、产量、国内生产总值等),这类变量称作数量变量、国内生产总值等),这类变量称作数量变量、定量变量或数量因素然而,在实际问题的研定量变量或数量因素然而,在实际问题的研究中,经常会碰到一些非数量型的变量,如性究中,经常会碰到一些非数量型的变量,如性别、民族、职业、文化程度、地区、正常年份别、民族、职业、文化程度、地区、正常年份与干旱年份、改革前与改革后等定性变量与干旱年份、改革前与改革后等定性变量 在建立一个实际问题的回归方程时,经常在建立一个实际问题的回归方程时,经常需要考虑这些定性变量例如,建立粮食产量需要考虑这些定性变量例如,建立粮食产量预测方程就应考虑到正常年份与受灾年份的不预测方程就应考虑到正常年份与受灾年份的不同影响;建立空调的销售模型时,除了要考虑同影响;建立空调的销售模型时,除了要考虑居民收入和商品价格这两个量的因素之外,还居民收入和商品价格这两个量的因素之外,还必须将必须将“季节季节”这个质的因素,作为一个重要这个质的因素,作为一个重要解释变量。
解释变量 由于受到质的因素影响,回归模型的参数由于受到质的因素影响,回归模型的参数不再是固定不变的例如,在空调销售模型中,不再是固定不变的例如,在空调销售模型中,收入、价格与空调销售额的关系是随着季节变收入、价格与空调销售额的关系是随着季节变化而改变的,也就是说,在不同的季节回归模化而改变的,也就是说,在不同的季节回归模型的参数也会有所不同再如,我国居民的消型的参数也会有所不同再如,我国居民的消费行为在改革开放前后大不相同,因此消费函费行为在改革开放前后大不相同,因此消费函数的参数也会发生变化显然,如果忽略质的数的参数也会发生变化显然,如果忽略质的因素,仍把模型中的参数看作是固定不变的,因素,仍把模型中的参数看作是固定不变的,得到的参数估计量就不能正确描述经济变量之得到的参数估计量就不能正确描述经济变量之间的关系间的关系 在回归分析中,对一些自变量是定性变量在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取的先作数量化处理,处理的方法是引进只取“0 0”和和“1 1”两个值的两个值的0 0−1 1型虚拟自变量当型虚拟自变量当某一属性出现时,虚拟变量取值为某一属性出现时,虚拟变量取值为“1 1”,否,否则取值为则取值为“0 0”。
例如,令例如,令“1 1”表示改革开放表示改革开放以后的时期,以后的时期,“0 0”则表示改革开放以前的时则表示改革开放以前的时期再如,用期再如,用“l l”表示某人是男性,表示某人是男性,“0 0”则则表示某人是女性虚拟变量也称为哑变量需表示某人是女性虚拟变量也称为哑变量需要指出的是,虽然虚拟变量取某一数值,但这要指出的是,虽然虚拟变量取某一数值,但这一数值没有任何数量大小的意义,它仅仅用来一数值没有任何数量大小的意义,它仅仅用来说明观察单位的性质和属性说明观察单位的性质和属性 如果在回归模型中需要引入多个如果在回归模型中需要引入多个0 0−1 1型虚型虚拟变量拟变量D D时,虚拟变量的个数应按下列原则来时,虚拟变量的个数应按下列原则来确定:对于包含一个具有确定:对于包含一个具有k k种特征或状态的质种特征或状态的质因素的回归模型,如果回归模型不带常数项,因素的回归模型,如果回归模型不带常数项,则中需引入则中需引入k k个个0 0−1 1型虚拟变量型虚拟变量D D;如果有常数;如果有常数项,则只需引入项,则只需引入k k−1 1个个0 0−1 1型虚拟变量型虚拟变量D D。
当当k=2k=2时,只需要引入一个时,只需要引入一个0 0−1 1型虚拟变量型虚拟变量D D 计算公式如下计算公式如下 下面以自变量所含定性变量是一个还是多下面以自变量所含定性变量是一个还是多个来分别说明如何构造含虚拟自变量的回归模个来分别说明如何构造含虚拟自变量的回归模型 ((1 1)自变量中只含一个定性变量,且这)自变量中只含一个定性变量,且这个定性变量只有两种特征的简单情况时个定性变量只有两种特征的简单情况时 ((2 2)自变量中含多个定性变量时自变量中含多个定性变量时 研究问题研究问题 研究采取某项保险革新措施的速度研究采取某项保险革新措施的速度y y与保与保险公司的规模险公司的规模x1x1及其类型及其类型d d之间的关系,数据之间的关系,数据如表如表7-67-6所示2 SPSS中实现过程中实现过程表表表表7-6 7-6 保保保保险险险险公司革新情况公司革新情况公司革新情况公司革新情况iyx1d1171510226920321175043031052210406027707122100819120094290010162380112816411215272113112951143868115318511621224117201661181330511930124120142461 实现步骤实现步骤图图图图7-23 “Linear Regression”7-23 “Linear Regression”对话对话对话对话框(三)框(三)框(三)框(三) ((1 1)第一部分输出结果文件中的第一个)第一部分输出结果文件中的第一个表格如下表所示。
表格如下表所示3 结果和讨论结果和讨论 ((2 2)输出的结果文件中第二个表格如下)输出的结果文件中第二个表格如下表所示 ((3 3)输出的结果文件中第三个表格如下)输出的结果文件中第三个表格如下表所示 ((4 4)输出的结果文件中第四个表格如下)输出的结果文件中第四个表格如下表所示。
