好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

DPS数据处理系统V2(C18-多因子分析).doc

23页
  • 卖家[上传人]:x****x
  • 文档编号:287229400
  • 上传时间:2022-05-03
  • 文档格式:DOC
  • 文档大小:931.50KB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第18章多因子分析多因子分析是一种将多变量<指标>样本在结构上进行简化的有效方法.通过分析找到一个包含最佳变量的子集合,使其所包含的变量能反映总体的结构.这种简化结构的处理对研究多因素之间的规律和构造模型等有重要的作用.DPS系统提供的关于多因素分析的主要功能模块包括主成分分析、因子分析、对应分析与典型相关分析等5种分析方法.18.1 主成分分析18.1.1 基本原理主成分概念由Karl Pearson于1901年提出,由Hottelling于1933年推广到随机变量,主成分分析是多元统计分析中的重要统计方法,是用较少的综合指标来代替原来较多的指标.多元分析中的随机变量,是对同一个体进行测量结果.从多个实测变量提取较少、互不相关综合指标,反映总体信息,这种综合指标就称为主成分.主成分分析可在不丢掉主要信息前提下,避开变量间共线性问题,便于继续用其他多元统计方法进行分析.设两个变量n个样品,在二维空间分布大致为一椭圆.作坐标旋转,使新坐标系为椭圆长、短轴方向,坐标旋转公式为对于标准化后的数据,旋转角度为45°.如有11个样本的两个变量数据,实施标准化后显示如图18-1中的小圆圈.图18-1 两变量主成分分析¾¾坐标旋转从图18-1可以看出,各点坐标呈正相关.主成分分析,数据点顺时针旋转45°后处于星号点位置.这时数据点大部分在横坐标方向,变异<方差>集中在横轴,为第一主成分;纵轴方向变异<方差>较小,为第二主成分.且相关为零.一般地,设变量xi的样本均数和样本样本差分别为和si,i=1,2,…,m.变量标准化公式为对标准化后的变量zi寻求主成分.第一主成分C1是z1,z2,…,zm的线性组合,即C1要尽可能多地反映原m个变量的信息,在的条件下,C1的方差Var要尽可能大.如把 a11,a12,…,a1m视为向量,代表m维空间的一个方向,相当于个体z1,z2,…,zm在此方向的投影最为分散.若第一主成分不足以代表原m个向量,则再考虑第二主成分C2.为有效地代表原变量的信息,C1中已有的信息不再在C2中出现,C2与C1协方差为0.这相当于在与前一个向量垂直的所有方向中,寻找一个方向,使所有个体在其上的投影最分散.类似地,考虑第三主成分,即C1、C2中已有的信息不再在C3中出现.这相当于在与前两个向量垂直的所有方向中,寻找一个方向,使所有个体在其上的投影最分散,即Cov=0,Cov=0这样,直至找到最多m个主成分.设相关系数矩阵的特征根,按从大到小排列顺序为λ1≥λ2≥…≥λm≥0.可以证明,各主成分对应的系数ai1,ai2,…,aim就是相关系数矩阵的特征向量,特征根λi就是第i个主成分的方差,所有主成分方差之和等于特征根之和,即.每个特征根所占总方差的比例,称为特征根的贡献.通常取主成分的个数为包含80%以上信息的变量,即特征根的累积贡献率≥80%.18.1.2 DPS平台的操作示例在编辑状态下输入编辑数据,每一行为一个样本,每一列为一个变量,编辑好数据后将待分析的所有数据定义成数据矩阵块.例如,选取x1为城镇单位在岗职工平均工资<元>,x2为各市固定资产投资<万元>,x3为各市进口总额<万美元>,x4为社会消费品零售总额<万元>,x5为各市工业增加值<亿元>,x6为财政收入<亿元>.原始数据编辑和定义如图18-2.ABCDEFGHI1代码地区X1X2X3X4X5X621合肥163693504887660472397739198.4600104395532淮北13379566257474445610076.960020263743毫州9707397183130388703418.880010594854宿州10572414932175375198427.670012826165蚌埠1228487666718269101566960.090033270076阜阳97386049355822130790830.540022279987淮南16970778830243863001476.640027220398滁州100066174361354386601358.5900222794109六安10217636760996799691234.55001610251110马鞍山20946138078116406526527150.15004269371211巢湖11469720416714185377843.41001572741312芜湖141651504005294131025363149.17005688991413宣城127959661881158072327845.13001653191514铜陵127625846961358334310765.31001664541615池州12008501780498627831015.0400865751716安庆1120898136713364129518979.80003379471817黄山12719716491444840879615.68009994919图18-2 主成分分析的数据编辑与数据块定义示意图在菜单下选择"多元分析"→"多因素分析"→"主成分分析"项,执行后系统首先显示第一、第二主成分得分图〔图18-3〕.图18-3主成分分析结果图形界面散点图显示出了各个样本的第一、第二主成分得分情况.DPS v13.01以后的版本增加了可以根据协方差阵进行主成份分析〔前面版本是根据相关系数进行分析〕的功能,取消了样本数必须大于变量数的限制.同时主成份分析输出结果图增加了95%的置信区间椭圆图、凸多边形、以与最小支撑树.该图形是主成分分析结果的常用表达方式.点击上部的按钮可对图形进行编辑加工,加工处理后可放到研究报告、论文之中.点击右上角,退出图形界面,系统输出结果如下:变量平均值标准差相关 X<1>X<2>X<3>X<4>X<5>X<6>X<1>12783.182892.8910.53940.3968-0.00110.72720.5323X<2>926683709397.260.539410.96060.76570.85850.9637X<3>13223.9414951.110.39680.960610.77610.83280.9513X<4>868454.17484542.57-0.00110.76570.776110.53840.7866X<5>67.415950.89490.72720.85850.83280.538410.9196X<6>276569.17228243.580.53230.96370.95130.78660.91961相关系数临界值,a=0.05时,r=0.4821;a=0.01时,r=0.6055 偏相关系数矩阵〔略〕Bartlett球形检验,卡方值Chi=155.7152,df=15,p=0.0000规格化特征向量因子1因子2因子3因子4因子5因子6x<1>0.26920.75790.38510.32060.18190.2625x<2>0.4550-0.0469-0.11420.5278-0.5763-0.4088x<3>0.4438-0.1602-0.62470.16740.25630.5417x<4>0.3536-0.57240.66670.0081-0.02560.3196x<5>0.43130.2606-0.0550-0.7482-0.41860.0897x<6>0.4610-0.04690.0293-0.17560.6271-0.6003No特征值百分率%累计百分率%Chi-Squaredfp值14.641277.353977.3539155.7152200.000021.100718.344495.698390.1542140.000030.13132.187897.886132.846090.000140.10641.773899.659925.496550.000150.01150.191999.85180.218820.896460.00890.1482100001.0000主成分得分NoYYYYYYN<1>7.3317-1.0901-0.08340.4158-0.0138-0.0251N<2>-0.79680.8219-0.0956-0.3874-0.0749-0.1062¼¼¼¼¼¼¼N<17>-1.53180.4054-0.20730.6270-0.0191-0.132518.1.3主成分分析结果解释主成分分析结果一般根据图18-3,即分析样本从高维投影到两维空间后,它们之间关系,结合专业背景进行解释.解释结果,需取多少个主成分,没明确指标.一般建议是取当特征值累积贡献率达80%,或特征值大于1,或特征值统计检验显著水平p<0.05时的主成分数.目前,不少人将主成分分析用于综合评价,并将前m个特征值较大的主成分得分y1,L,ym,按照公式计算m个主成分的"综合值".这里li是第i个主成分的特征值,p为变量数.然后根据综合值进行排序、解释.理由是这样做充分地利用了所有信息对样本进行排序.如本例前2个主分量所构成信息量为总信息量的95.7%,几乎反映了全部信息.这2个主分量中,第一主成分y1=0.269x1+0.455x2+0.444。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.