
实证研究方法及大数据处理.doc
33页word第七章 实证研究方法与数据处理——结构方程模型与以往依据经验推导出理论知识的研究X式不同,实证研究强调理论知识的可靠性必须建立在观察和实验的经验证明的根底之上实证研究通过经验观察的数据和实验研究的手段来证明理论假设,就必须要求这种假设具有可证性实证研究方法不仅在自然科学领域得到广泛应用,而且已对社会科学的研究产生深刻影响,提升了社会现象的研究的准确性和科学性实证研究的过程一般包括如下几个步骤:〔1〕问题确定研究问题或是来源于研究者在实践中遇到的新问题或是在已有理论根底上的拓展,前一类问题研究往往有很强的创新性,但由于缺乏相关研究支撑,难度可能也较大,后一类类问题难度往往较小,但创新程度也可能不大研究者往往需要在这两个方面进展平衡〔2〕文献研究文献研究有助于研究者熟悉所研究领域,对研究问题的价值进展评估,并寻找到真正的问题所在,同时有助于防止无意义的重复研究〔3〕提出理论框架和假设理论框架主要包括变量、变量间关系和系统图,如路径分析和结构方程模型中的变量间关系的路径图假设如此是指将变量间关系的合理推测以可验证的命题表达出来〔4〕样本选择与数据采集样本的选择根据问题的差异而定,样本的数据或局部数据可以从公开的数据中获得如年鉴、报刊、上市公司年报等,也可以通过问卷调查的方式获得。
〔5〕数据分析与假设检验数据分析一般结合各种统计软件进展,根据数据分析的结果可以确定测量模型是否合理以与总体模型的拟合情况,根据这些结果就可以进一步地确定能否对假设进展验证本章主要介绍实证研究方法中的结构方程模型方法,并按照结构方程模型的思想来源分别介绍因子分析〔包括探索性因子分析和验证性因子分析〕、路径分析等探索性和实证性的方法,接着重点介绍结构方程模型,最后应用结构方程模型软件Amos7.0对验证性因子分析、路径分析和结构方程模型加以应用举例,注重通过对不同方法之间关系的比拟使研究者逐步加深对结构方程模型方法和技术的理解和掌握结构方程模型〔Structural Equation Modeling, 简称SEM〕是一种融合了因子分析和路径分析的多变量统计方法和技术,是第二代数据分析方法和技术,能够进展高质量的数据分析与第一代数据处理技术如回归分析相比,结构方程模型能够对多个自变量和多个因变量的关系进展建模并通过简单而系统的分析同时解决一系列相关研究问题,同时,可以通过多个可直接观测变量来衡量无法直接观测的潜在变量,减少了变量的测量误差,根本上提高研究的精度因此,结构方程模型方法的问世极大便利了理论研究的验证。
自上世纪80年代以来,随着电脑科技的开展,该技术日益成熟,成为多变量数据分析的重要工具,日益受到研究者的青睐目前,已经有多种软件可以处理SEM,包括:LISREL,AMOS, EQS, Mplus等因子分析(Factor Analysis)起源于心理学,该领域的诸多变量如智力、动机、能力、兴趣等的无法直接测量,需要通过外显行为来测量,因子分析就是寻找许多可直接观测的指标或变量背后的不可直接观测的解释因子因子分析的思想是结构方程模型分析的重要组成局部,该思想的出现增加了难以直接观测的潜在变量衡量的准确性,减少了测量误差,使得变量间因果关系模型的研究更为接近事实真相按照用途和处理方法的不同,因子分析可分为探索性因子分析和验证性因子分析1.探索性因子分析〔EFA〕和主成分分析〔PCA〕探索性因子分析〔Exploratory Factor Analysis〕和主成分分析〔Principal ponents Analysis〕都是探索性的技术,是多变量统计中降低变量维度的方法,理清两者之间的关系有助于加深对因子分析的理解探索性因子分析和主成分分析的共同点在于通过找出不可直接观察的因子,对具有高度相关性的变量作精简,都是为了将变量进展归类。
但在使用目的和数据处理上两者仍然存在着差异,探索性因子分析假设在实际的观测变量之下,存在着少数没有被观察到的潜在变量或构念,而主成分分析试图用数学方法推导出少数变量来传达尽可能多的信息代表主成分,代表变量或测量指标图7.1 主成分分析代表因子,代表变量或测量指标图7.2 探索性因子分析两种测量方法的差异如图7.1和图7.2所示方框代表可直接观测的变量或指标,圆框代表主成分或因子,箭头代表因果关系从图中可以看出,主成分分析中的主成分是所有变量的线性函数,并且不允许变量有测量误差;相反,因子分析是将变量区分为共同因子和测量误差两局部,变量是不可观察因子的线性函数为便于研究者深入理解并掌握探索性因子分析方法,我们首先给出探索性因子分析的步骤和流程图,接着结合SPSS软件分析通过案例分析具体介绍这一方法探索性因子分析一般包括如下步骤:选取变量,并将其标准化;分析变量间的相关系数矩阵;求解公共因子与因子负荷矩阵;通过因子旋转得出因子得分;结果分析其分析流程如图7.3所示是否模型评价选取变量分析相关系数矩阵其他分析因子旋转因子得分结果分析斜交旋转正交旋转求解共因子与负荷矩阵相关系数是否图7.3 探索性因子分析流程图例7.1 由于主成分分析在前面已有介绍,在此,我们仅介绍探索性因子分析的软件分析步骤和结果解释。
我们基于2006年49家上市公司局部指标进展探索性因子分析,样本与指标见表7.1我们相信,在这些指标中可能会存在3个反映上市公司经营情况的潜在结构,大体上应该有收益、收益增长和负债等三个方面,据此我们通过探索性因子分析看看这些指标能否结合到这三个方面表7.1 样本数据公司简称主营业务收入净利润净利润率净资产增长率总资产增长率营业利润增长率每股收益流动资产财务费用现金负债比率现金流负债比债务资产比率万科A1.78E+1021546393154.47E+101.4E+08国农456389981.5E+08774295深振业1.25E+092162537651.65E+0924453738深达声1.94E+08-915233942.95E+0838976357宝利来10356391-175605938218721-76015深宝安2.49E+091002650514.16E+091.17E+08华新9863814972044441.73E+087628125深物业3.12E+08-460542211.24E+0915268771南玻A2.95E+093321115531.29E+0987982201沙河股份3.35E+08310221519.34E+086851109深康佳1.27E+101026384358.52E+0913844699中华2.2E+08-964801581858008-1.4E+07深中冠2.41E+08300579072.4E+089814511深深宝1.02E+08390594052.07E+082876537华发A1.61E+08-195542481.39E+085203253长城开发1.03E+103411852082.74E+0975597深赤湾1.91E+096139648284.41E+0851050121深天地6.63E+08324889425.02E+089840187招商地产2.94E+095679123851.09E+10-7902914特力A1.13E+09-921487912.92E+0811645245飞亚达4.87E+08292632214.85E+085684509深能源6.95E+098001102394.75E+0972520665一致药业5.67E+09725552292.11E+0921028176深深房9.91E+08192594851.96E+0931186645盛润18660262-97564978421533570-97-97中粮地产3.46E+081744283178.06E+0823773931深桑达1.69E+09413181451.06E+099012109新都酒店76419872-1388798563570106810749218深泰3.42E+0829557374.15E+0843840201华联控股5.36E+091929080964.96E+091.38E+08深南电3.86E+09634661091.72E+091.2E+08中集集团3.32E+1027717230861.51E+1064233027鸿基5.72E+08122022591.17E+0950010382深长城8.31E+08761561892.19E+0957228136深南光1.41E+09698097381.79E+0913850139泛海建设1.34E+092552619036.9E+093464128康达尔7.46E+08-951811893.59E+0840024997德赛电池8.69E+08200382694.33E+087863900深天马1.51E+09937956108.32E+0836214863方大A6.71E+0879868126.11E+0821687075深国商71030842-114798986.14E+089243038深赛格。












