
主成分分析报告操作步骤.doc
10页实用标准文档主成分分析操作步骤1)先在spss中录入原始数据2)菜单栏上执行【分析】一一【降维】一一【因子分析】,打开因素分析对话 框,将要分析的变量都放入【变量】窗口中3)设计分析的统计量点击【描述】:选中“ Statistics ”中的“原始分析结果”和“相关性矩阵”中的“系数”选中原始分析结果,SPSS自动把原始数据标准差标准化,但不 显示出来;选中系数,会显示相关系数矩阵)然后点击“继续”@因子分析 氐 \博因子分忻:拒述疣计-Stabstics-单菠丘扌証性应)-相笑性距阵显普性水平世} 再生迟)订列式卫) 反峡象匡)回D和目;artlmU的逑总度检脸両口:取浦][冒则点击【抽取】:“方法”里选取“主成分”;“分析”、“输出”、“抽取”均选中各自的第一个选项即可方迭廻1:主成悄 T-分析- 1 [編出◎相剜s矩阵迟) 7 的园子解®◎冏方蓬矩阵世) 目碎石E(S)-抽取 ®基于特征值{目 特WIA于址}: [l J因子的固定救虽也要壊取的因子①:器犬收做性迭代次數退X |药I[g^][^][ w]点击【旋转】:选取第一个选项“无” (当因子分析的抽取方法选择主成分法时,且不进行因子旋转,则其结果即为主成分分析)点击【得分】:选中“保存为变量”,方法中选“回归”;再选中“显示因子得分系数矩阵”点击【选项】:选择“按列表排除个案”。
4) 结果解读5) A.相关系数矩阵:是6个变量两两之间的相关系数大小的方阵 通过相关系 数可以看到各个变量之间的相关,进而了解各个变量之间的关系相關性矩陣食品衣着燃料住房交通和通讯娱乐教育文化相關 食品1.000.692.319.760.738.556衣着.6921.000-.081.663.902.389燃料.319-.0811.000-.089-.061.267住房.760.663-.0891.000.831.387交通和通讯.738.902-.061.8311.000.326娱乐教育文化.556.389.267.387.3261.000B.共同度:给出了这次主成分分析从原始变量中提取的信息,可以看出交通和 通讯最多,而娱乐教育文化损失率最大Communalities起始擷取食品1.000.878衣着1.000.825燃料1.000.841住房1.000.810交通和通讯1.000.919娱乐教育文化1.000.584擷取方法:主體元件分析C.总方差的解释:系统默认方差大于1的为主成分如果小于1,说明这个主 因素的影响力度还不如一个基本的变量 所以只取前两个,且第一主成分的方差 为3.568,第二主成分的方差为1.288,前两个主成分累加占到总方差的80.939%<說明的變異數總計元件起始特徵值擷取平方和載入總計變異的%累加%總計變異的%累加%13.56859.47459.4743.56859.47459.47421.28821.46680.9391.28821.46680.9393.60010.00190.9414.3585.97596.9165.1422.37299.2886.043.712100.000擷取方法:主體元件分析D.主成分载荷矩阵:元件矩陣元件12食品.902.255衣着.880-.224燃料.093.912住房.878-.195交通和通讯.925-.252娱乐教育文化.588.488擷取方法:主體元件分析a.擷取2個元件。
特别注意:该主成分载荷矩阵并不是主成分的特征向量, 即不是主成分1和主成分2的系数主成分系数的求法:各自主成分载荷向量除以各自主成分特征值得算数平方根则第1主成分的各个系数是向量 (0.925,0.902,0.880 , 0.878,0.588,0.093)除以.3.568 后才得到的,即(0.490, 0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量,满足条件是系数的平方和等于 1,分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式(作业中不用写公式):Y1=0.490*Z 交+0.478*Z 食+0.466*Z 衣+0.465*Z 住+0.311*Z 娱+0.049*Z 燃 同理可求出第2主成分的函数表达式E.主成分得分系数矩阵元件評分係數矩陣元件12食品.253.198衣着.247-.174燃料.026.708住房.246-.152交通和通讯.259-.196娱乐教育文化.165.379擷取方法:主體元件分析元件評分该矩阵是主成分载荷矩阵除以各自的方差得来的, 实际上是因子分析中各个因子 的系数,在主成分分析中可以不考虑它元件評分共變異數矩陣元件1211.000.0002.0001.000擷取方法:主體元件分析元件評分6)因子得分 在之前的“得分”对话框中,由于选中了 “保存为变量”,方法中的“回归”;又选中了 “显示因子得分系数矩阵”,因此SPSS的输出结果和原始数据一起显示在数据窗口里:宜.主成分分修换|黑提卸卩1眈5PS5血ati就由戢拓说麵器衣件近)络辑回视亟凹數退切转按卫井析谢 ERJ© 实用理序◎ 离口㈣帚助凹地区住屋交通痢讯幌示敎奇文化FAC1 1FAC2_11北京190.3343.779.7360.5449.019.043104910-.22B722天津135 2036 4010 4744 1635493 3441770-1 036SD3间北95.2122.S39.3022.4422.812.B0-1.03856-1.D1B634山西104.7825 11£.409.8918.173.25-1 00619-1.3178G512S412?«讪12 5823 9$227-72763-1 102726辽宁145.6832.83177927.2939.093.47.27382456017吉林159.3733.3S1B3711.8125.29S.22095661.3S274e116222^.5713 2413.7621 756 043S276470$?9上海221.1138.6412.5311)6.6550.825.B92.35583M333510江苏"14 5S2J1211 6742.6027 305 74057W-1565411浙江169.92327512.7247.1234.355U00.63562-.0499012135.11123.0915 6223.5418.206.39-.437921.2917613144 9221 2616 9619 5221 T5& 37-377671 6065814江西140.5421.5017.6419.1915.974.34-.677661.4908516山东116.0430.2612.2033.6D33.773.B6-.11693-.5695016101.1823 269 4620 2020 504 30-$1423-76448町见:9变量的1.FAC1 12.049Q3603207577)主成分得分特别提醒: 后两列的数据是北京等16个地区的因子1和因子2的得分,不是主成分1和主 成分2的得分。
主成分的得分是相应的因子得分乘以相应的方差的算数平方根即:主成分1得分=因子1得分乘以3.568的算数平方根主成分2得分=因子2得分乘以1.288的算数平方根 得出各地区主成分1和主成分2的得分如下表:也*林範2蔺掘集1]-】驸益i廷唾晟弄丈件世)荒辑匡)薮据回转按Q) 分折址】直禅型)图形迫)实1 :■ ^^1■ H■A 严3*t£Ey I11:地区酣1ET2主成知主谢1北京2 04910-228723 87053-25957I 241770-1 036807390C-1.176673-1 03856-1 01363■1 96175-1.15G044山西-1 08619-1 31786-2.05172L -1495645内幕- 72763-1 10272-1.37481-1 251486辽宁273S24660151722.517537095661 36274180691 54657吕-.3327847057-.74193.5340592.35583-43335444996-49181110江苏-05796-15654-109481776611淅江G3552-.049901.20044-.0566312-.4379215917®-.827131.4660213 |增建-.377671.60656-71339F 1 3233114江西- 677561.490851.27986£ 1.6919715山东-11693-.56960-22087-.6463316间南-91423-7&446-172690-.8676117魏陽视图{刖后两列就是16个地区主成分1和主成分2的得分。
有兴趣的同学可以验证一下:上面推导出来的主成分的函数关系式计算出来的主成分得分是否与该数据栏的的得分一致)8)综合得分及排序:每个地区的综合得分是按照下列公式计算的:化简得1 .2K8 *主成。












