
SPSS判别和主成分因子分析方法.docx
4页判别和主成份/因子分析上机作业1、(1)首先将原始数据进行标准化处理,计算协方差矩阵:C1C2C3C4C11C20.730911C30.416270.250821C40.482290.724020.395551其次,由协方差矩阵计算特征值,以及各个主成分的贡献率和累计贡献主成分特征值贡献率%累积贡献率%C12.538163.563.5C20.797819.983.4C30.517412.996.3C40.14683.7100主成分数的确定:第1、第2的主成分的累积贡献率已高达83.4%;第1主成分的特征根大于1,第2主成分的特征根接近于1,故只需求出 第1与第2主成分Z1,Z2即可最终保留2个主成分经济增长率和非 国有化水平2)首先计算各变量的平均值与标准差;变量C1C2C3C4平均值13.4652.01314.911764.579标准差3.9164219.628515.408510.9591其次求得特征向量:变量PC1PC2C10.529-0.070C20.558-0.410C30.3690.901C40.523-0.127由此得出主成分:Y1=0.529*x11-0.558*x22-0.369x33+0.523x44Y2=-0.07*x11-0.41*x22+0.901x33-0.127x44 主成分系数为:X11=(x1-13.46)/3.91642X22=(x2-52.013)/19.6285X33=(x3-14.9117)/15.4085X44=(x4-64.597)/10.9591所以得出主成分表达式为:Y1=0.1314x1-0.0278x2-0.0232x3-0.0472x4-6.6040Y2=-0.0174x1-0.0204x2-0.0566x3-0.0114x4+1.1901(3)计算各变量在主成分Z1, Z2上的载荷Z1Z2对前三个成分的贡献C10.529-0.070.2847C20.558-0.410.4795C30.3690.9010.1523C40.523-0.1270.2897第1主成分与C1,C2, C3, C4均呈较强正相关,因此可认为第1主成分Z1是 地区经济增长差异代表。
第2主成分与C3呈较强正相关,与C1,C2, C4呈较强负相关,因此可认为第 2主成分Z2代表了开放度由两个主成分Z1与Z2代替原4个变量描述地区经济增长差异,可以使问题进 一步简化、明了4)对上述两个主成分进行判别分析,得到费歇尔判别方程为:主成分 1: Y=1.812*x1-0.337*x2-0.058*x3+1.38*x4-54.567主成分 2: Y=1.:669 *x1-0.337*x2-0.119*x3+1.188*x4-36.746Classification Function CoefficientsVAR0000612x11.8121.669x2-.337-.377x3-.058-.119x41.3801.188(Constant)-54.567-36.746Fisher's linear discriminant functions交叉验证下,总的错判率为11.9%,其中主成分1的错判率为50%,主成分2的错 判率为6.2%Classification ResultsaVAR00006Predicted Group MembershipTotal12OriginalCount1112211516%150.050.0100.026.293.8100.0Classification ResultsaVAR00006Predicted Group MembershipTotal12OriginalCount1112211516%150.050.0100.026.293.8100.0a. 88.9% of original grouped cases correctly classified.2、解答:(1)首先将原始数据标准化,进行协方差分析:C5C6C7C8C5 1.00000C6 -0.060391.00000C7 0.99161-0.068071.00000C8 0.24670.950750.236861.00000其次,计算各主成分特征值、贡献率和累积贡献率X1X2X3X4特征值2.17581.81410.00860.0016比率0.5440.4540.0020.000累积0.5440.9971.0001.000然后,主成分数的确定:X1与X2的累积贡献率已达99.7%,二者的特征值均大于1,故只需做出第1 与第2的主成分即可。
最终保留两个主成分最后,计算主成分表达式:各变量的均值与标准差:变量X1X2X3X4平均值-0.02350.0280-0.06450.0016标准差1.02992.08292.06671.7125主成分系数:X11=(x1+0.0235)/1.0299X22=(x2-0.028)/2.0829X33=(x3+0.0645)/2.0667X44=(x4+0.0016)/1.7125求得特征向量:变量 PC1 PC2C5 0.553 -0.426C60.3560.632C70.55-0.432C80.5150.483因此主成分表达式为:Y1=0.5396x1-0.1709x2-0.2661x3+0.3007x4+0.0246Y2=-0.4136x1+0.3034x2-0.2090x3+0.2820x4-0.0321⑵以主成分为自变量,Y为因变量采用Enter法得到回归方程:Amova^模型,平方和」df P均方」回归,82.597^2+41.293+565.0314.000"圮 残差,7 一皿|97+.073+总计,89.687^99+a. 因变星:YPb. 预测变星:(常是),e2,泌黛数”模型,非标准化箫数,标准箫数」t】E】标准误差4试用弭,(常量),-.016^.027+-.587+.559+IP E1P.605^.018+一 937*32.025+.000+口一1顺.020-.20647.231+.000+a.因变星:Y口Y=0.605*z1+0.146*z2-0.016 R2=0.892决定系数为0.892对方程的显著性进行检验:查表得F005(1,98)=3.92 <565.031,回归方程显著对回归系数的显著性进行检验,查表,t005(98)=1.658,对照上表可知,该回 归系数亦显著。












