
主成分分析实验报告2800字.docx
19页主成分分析实验报告2800字 主成分分析地信0901班 陈任翔0103090312【实验目的及要求】掌握主成分分析与因子分析的思想和具体步骤掌握SPSS实现主成分分析与因子分析的具体操作实验原理】1.主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标由此可见,主成分分析实际上是一种降维方法2.因子分析研究相关矩阵或协方差矩阵的内部依赖关系,它将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系实验步骤】 1. 数据准备? 1)首先在Excel中打开“水样元素成分分析数据”,删除表名“水样元素成分分析数据”,保存数据2.? 3)数据格式转换数据描述分析操作 1)Descriptives过程点击Analyze下的Descriptive Statistics选项,选择该选项下的Descriptives ? 选中待处理的变量(左侧的As…..Hg等);? 点击 使变量As…..Hg 移至Variable(s)中; ? 选中Save standrdized values as variables; ? 点击Options2)数据标准化标准化处理后的结果2. 主成分分析1) 点击Analyze下的Data Reduction选项,选择该选项下的Factor过程。
选中待处理的变量,移至Variables2) 点击Descriptives判断是否有进行因子分析的必要? Coefficients(计算相关系数矩阵 )? Significance levels(显著水平)? KMO and Bartlett’s test of sphericity (对相关系数矩阵进行统计学检验 )? Inverse(倒数模式):求出相关矩阵的反矩阵;? Reproduced(重制的):显示重制相关矩阵,上三角形矩阵代表残差值,而主对角线及下三角形代表相关系数;? Determinant(行列式 ):求出前述相关矩阵的行列式值;? Anti-image(反映像):求出反映像的共同量及相关矩阵 Univariate descriptive单变量描述统计量(输出被选中的各变量的均数与标准差 )? Initial solution未转轴之统计量(显示因素分析未转轴前之共同性、特征值、变异数百分比及累积百分比)3) 点击Extraction :? 选择主成分分析方法? 输出未旋转的因子载荷矩阵4) 点击Rotation5)点击Scores? 选中Save as variables (把因子得分作为新变量保存在数据文件中 ) ? 选中Regression(回归因子得分)? 点击Continue6)点击Options? 选中Exclude cases listwise(去除所有含缺失数据的样本、再进行分析) ? 选中Sorted by size(载荷系数将按照数值大小排列,并构成矩阵) ? 点击Continue3.结果分析? SPSS输出的第一个表格列出了标准化后数据的平均值(Mean)、标准差(Std. Deviation)和分析用到的取值个数(N)? 系统输出的第2个表格是8个原始变量的相关矩阵与单尾显著性检验(多个变量之间的相关系数较大,说明这些变量之间存在着较为显著的相关性,且其对应的Sig值普遍较小,根据分析,这些数据有进行因子分析的必要。
KMO检验法和巴特利特球形检验法(KMO and Bartlett Test of Sphericity)的检验结果(Bartlett球形检验统计量的Sig<0.01,认为各变量之间存在着显著的相关性一般,KMO大于0.9时效果最佳,0.7以上可以接受,0.5以下不宜作因子分析但是相关矩阵和Bartlett球形检验统计量的效果都比较好,认为是可以作因子分析)? SPSS输出的第四个表格“成分矩阵”是初始的未经旋转的因子载荷矩阵(已选出了3个主因子,以替代原有的8个变量所含的信息)? SPSS输出的第七个表格“旋转成分矩阵”是经过旋转(转轴法使得因素负荷量易于解释)后的因子载荷矩阵旋转后每个公因子上的载荷分配地更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量? 第1公因子代表Cd、Zn、As、Pb这几个变量因素? 第2公因子代表Cr、P两个变量? 第3公因子代表Cu、Hg两个变量? 可以根据实际情况对第1公因子、第2公因子、第3公因子命名? 我们将第1公因子命名为镉类,第2公因子命名为铬类,第3公因子命名为铜类)? SPSS输出的第八个表格“成分转换矩阵”是正交旋转后因素相关矩阵? SPSS输出的第六个表格表示各因子变量的特征值与累积贡献率(表明m个主成分综合原始变量的能力)(由于前3个特征值累计贡献率达到91.798%,根据累计贡献率大于85%的原则,故选取前三个特征值)? SPSS输出的第五个表格表示变量的共同度(m个公共因子对第i个变量Xi的方差贡献 )(As的共同度为0.974,可以理解为3个公共因子能够解释As的方差的97.4%;Pb的共同度为0.581,可以理解为3个公共因子能够解释As的方差的58.1%。
回到Data View窗口的当前数据集,会看到文件中增加了3列FAC1_1(第1因子得分)、 FAC2_1(第2因子得分)和FAC3_1(第3因子得分)(可以通过第1因子得分来了解镉类元素的分布情况,第2公因子来了解铬类元素的分布情况,第3公因子来了解铜类元素的分布情况样号为Z-W-2-02的样品Cd、Zn、As、Pb含量较高,样号为C-W-06-01的样品Cr、P含量较高,样号为C-W-01-02的样品重金属含量较高)zF(综合得分)= 46.048%* FAC1_1 + 24.085%* FAC2_1 + 21.665%* FAC3_1根据综合得分可以看出总体情况【实验总结】通过本次实验,了解SPSS软件的运行管理方式;熟悉各主要操作模块,窗口及其功能,相关的系统参数设置等基本掌握了应用SPSS软件Analyze菜单中的Data Reduction模块对数据进行主成分分析和因子分析,但是在操作过程和文字分析上还是有些生疏,有待进一步的熟练2011-11-4第二篇:主成分分析实验报告 1400字吉林财经大学2012-2013学年第一学期多元统计分析及SPSS统计软件应用基于主成分分析的实验报告院别:会计学院专业:会计学(注册会计师方向)班级:1028班姓名:邵美琪学号:0302102840主成分分析实验报告对我国31个省市自治区20xx年财政非税收入基本情况进行分析,考核的指标有:专项收入、行政事业性收费收入、罚没收入、国有资本经营收入、国有资源资产有偿使用收入、其他收入。
数据资料见表1所示各地区财政非税收入 (20xx年)将31个省市财政非税收入数据进行标准化,得出资料如下(表2):表2 标准化后的数据根据对以上数据的调查,现利用主成分分析法对我国31个省、直辖市、自治区的财政非税收入情况进行分析,得出结果具体如下:根据前三个特征值及初始因子载荷矩阵,计算出相应的特征向量,见表4:根据表4得到三个主成分的表达式为:Y1=0.3127X1+0.4729X2+0.4451X3+0.3604X4+0.4467X5+0.3886X6 Y2=0.6699X1-0.1876X2+0.2998X3+0.2569X4-0.3579X5+0.4822X6 Y3=0.4484X1-0.0309X2+0.1225X3-0.7560X4-0.1594X5+0.4246X6由表达式可知,第一主成分主要反映的指标为:行政事业性收费收入、国有资源资产有偿使用收入,第二主成分主要反映的指标为:专项收入、其他收入,第三主成分主要反映的指标为:专项收入、国有资本经营收入对个主成分所反映的经济意义列表如下:将标准化的数据分别代入表达式中,得出如下结果,见表6:表6分析结果:财政非税收入是指除税收以外,由各级政府、国家机关、事业单位、代行政府职能的社会团体及其他组织依法利用政府权力、政府信誉、国家资源、国有资产或提供特定公共服务、准公共服务取得的财政性资金,是政府财政收入的重要组成部分。
同过对我国31个省市自治区20xx年财政非税收入基本情况进行主成分分析之后,得分结果如上表所示从总体上看,第一主成分、第二主成分和综合的排名基本一致和第三主成分排名略有区别结合第一主成分、第二主成分、综合的排名上看,广东、山东和江苏财政非税收入较高,但从第三主成分排名来看广东、山东排名在中上位置,而江苏则处于最末,这主要源于20xx年国家投资经营效益不好,拉低了江苏省在第三主成分的排名与之相对应的宁夏、青海和西藏三省经济发展水平较低,地方经济明显落后于广东、山东和江苏,在第一主成分、第二主成分、综合及第三主成分的排名都比较低这主要源于财政非税收入与地方经济直接或间接相关利用国家服务和资源取得的收入提高,国家确定的专项收入会相应的提高,国家投资经营所得收入也会提高,但是没有那么明显相反利用国家服务和资源取得的收入降低,国家确定的专项收入会相应的降低,国家投资经营所得收入也会降低,但是同样不是很明显那么明显也就是说国家服务和资源取得的收入和国家确定的专项收入关联比较大,而和国家投资经营所得收入关联较小从分析中可看出国家服务和资源取得的收入、国家确定的专项收入和国家投资经营所得收入不同步我们的在提高国家服务和资源取得的收入和国家确定的专项收入的同时,注意国家投资经营所得收入的提高。
使三者能相辅相成,相互促进,是国家经济健康快速发展+ -全文完-。












