主成分分析法例子.ppt
20页一、主成分分析的基本原理 v假定有n个样本,每个样本共有p个变量,构成一个n×p阶的数据矩阵(1) v降维处理!!!当p较大时,在p维空间中考察问题比较麻烦降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标(2) v系数lij的确定原则: ① zi与zj( i≠j;i,j=1,2,…,m )相互无关; ② z1是x1,x2,…,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,…,xP的所有线性组合中方差最大者; …… zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线性组合中方差最大者 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP的第一,第二,…,第m主成分 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2 ,…, p)在诸主成分zi(i=1,2,…,m)上的载荷 lij( i=1,2,…,m; j=1,2 ,…,p)。
从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量 二、计算步骤 (一)计算相关系数矩阵(一)计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj的相关系数, rij=rji,其计算公式为:(3) (4) (二)计算特征值与特征向量:(二)计算特征值与特征向量: ① 解特征方程 ,求出特征值,并使其按大小顺序排列 ; ② 分别求出对应于特征值 的特征向量 ,要求 =1,即 ,其中 表示向量 的第j个分量③③ 计算主成分贡献率及累计贡献率 ▲贡献率:▲累计贡献率: 一般取累计贡献率达85—95%的特征值所对应的第一、第二、…、第m(m≤p)个主成分 (6) ④各主成分的得分三、 主成分分析方法应用实例表表1 1 某农业生态经济系统各区域单元的有关数据某农业生态经济系统各区域单元的有关数据 步骤如下:(1)将表1中的数据作标准差标准化处理,然后将它们代入公式(4)计算相关系数矩阵(见表2)。
表表2 2 相关系数矩阵 相关系数矩阵 (2)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表3)由表3可知,第一,第二,第三主成分的累计贡献率已高达86.596%(大于85%),故只需要求出第一、第二、第三主成分z1,z2,z3即可 表表3 3 特征值及主成分贡献率 特征值及主成分贡献率 (3)对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量l1,l2,l3表表4 4 主成分载荷主成分载荷 ①第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分z1是生态经济结构的代表 ②第二主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的情况,因此可以认为第二主成分z2代表了人均资源量 分析:分析:显然,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,…,x9),描述农业生态经济系统,可以使问题更进一步简化、明了。
③第三主成分z3,与x8呈显出的正相关程度最高,其次是x6,而与x7呈负相关,因此可以认为第三主成分在一定程度上代表了农业经济结构 20 以上有不当之处,请大家给与批评指正,谢以上有不当之处,请大家给与批评指正,谢谢大家!谢大家!。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


