电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

主成分分析法概念及例题[文]

11页
  • 卖家[上传人]:瑶***
  • 文档编号:146138300
  • 上传时间:2020-09-26
  • 文档格式:DOC
  • 文档大小:226.77KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、word可编辑实用文档主成分分析法出自 MBA智库百科(http:/ components analysis ,PCA)又称:主分量分析 ,主成分回归分析法 目录显示 1 什么是主成分分析法 2 主成分分析的基本思想 3 主成分分析法的基本原理 4 主成分分析的主要作用 5 主成分分析法的计算步骤 6 主成分分析法的应用分析 o 6.1 案例一:主成分分析法在啤酒风味评价分析中的应用1 6.1.1 1 材料与方法 6.1.2 2 主成分分析法的基本原理 6.1.3 3 主成分分析法在啤酒质量一致性评价中的应用 6.1.4 4 结论 7 参考文献编辑什么是主成分分析法 主成分分析也称主分量分析 ,旨在利用降维的思想 ,把多指标转化为少数几个综合指标。 在统计学中 ,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中 ,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上 ,第二大方差在第二个坐标(第二主成分)上 ,依次类推。主成分分析经常用减少数据集的维数 ,同时保持数据

      2、集的对方差贡献最大的特征。这是通过保留低阶主成分 ,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是 ,这也不是一定的 ,要视具体应用而定。 编辑主成分分析的基本思想 在实证问题研究中 ,为了全面、系统地分析问题 ,我们必须考虑众多影响因素。这些涉及的因素一般称为指标 ,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息 ,并且指标之间彼此有一定的相关性 ,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时 ,变量太 多会增加计算量和增加分析问题的复杂性 ,人们希望在进行定量分析的过程中 ,涉及的变量较少 ,得到的信息量较多。主成分分析正是适应这一要求产生的 ,是解决这类题的理想工具。 同样 ,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中 ,我们常常会选用几个有代表性的综合指标 ,采用打分的方法来进行评估 ,故综合指标的选取是个重点和难点。如上所述 ,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性 ,就必然存在着起支配作用的因素。

      3、根据这一点 ,通过对原始变量相关矩阵内部结构 的关系研究 ,找出影响科普效果某一要素的几个综合指标 ,使综合指标为原来变量的线 性拟合。这样 ,综合指标不仅保留了原始变量的主要信息 ,且彼此间不相关 ,又比原始 变量具有某些更优越的性质 ,就使我们在研究复杂的科普效果评估问题时 ,容易抓住主 要矛盾。 上述想法可进一步概述为:设某科普效果评估要素涉及个指标 ,这指标构 成的维随机向量为。对作正交变换 ,令 ,其中为正交阵 ,的各分量是不相关的 ,使得的各分量在某个评估要素中的作用容易解释 ,这就使得我们有可能从主分量中选择主要成分 ,削除对这一要素影响微弱的部分 ,通过 对主分量的重点分析 ,达到对原始变量进行分析的目的。的各分量是原始变量线性组合 ,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系 ,主成分分析使我们能从错综复杂的科普评估要素的众多指标中 ,找出一些主要成分 ,以便有效地利用大量统计数据 ,进行科普效果评估分析 ,使我们在研究科普效果评估问题中 ,可能得到深层次的一些启发 ,把科普效果评估研究引向深入。 例如 ,在对科普产品开发和

      4、利用这一要素的评估中 ,涉及科普创作人数百万人、科 普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算 ,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标 ,变量数减少 ,并达到一定的可信度 ,就容易进行科普效果的评估。 编辑主成分分析法的基本原理 主成分分析法是一种降维的统计方法 ,它借助于一个正交变换 ,将其分量相关的原随机向量转化成其分量不相关的新随机向量 ,这在代数上表现为将原随机向量的协方差阵变换成对角形阵 ,在几何上表现为将原坐标系变换成新的正交坐标系 ,使之指向样本点散布最开的p 个正交方向 ,然后对多维变量系统进行降维处理 ,使之能以一个较高的精度转换成低维变量系统 ,再通过构造适当的价值函数 ,进一步把低维系统转化成一维系统。 编辑主成分分析的主要作用 概括起来说 ,主成分分析主要由以下几个方面的作用。 1主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(mp) ,而低维的Y空间代替 高维的x空间所损失的信息很少。即:使只有一个主成分Yl(即 m1)时 ,这个Yl仍是使用全部X变量(p个)得到的

      5、。例如要计算Yl的均值也得使用全部x的均值。在所选的前m个主成分中 ,如果某个Xi的系数全部近似于零的话 ,就可以把这个Xi删除 ,这也是一种删除多余变量的方法。 2有时可通过因子负荷aij的结论 ,弄清X变量间的某些关系。 3多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形 ,多元统计研究的问题大都多于3个变量。要把研究的问题用图形表示出来是不可能的。然而 ,经过主成分分析后 ,我们可以选取前两个主成分或其中某两个主成分 ,根据主成分的得分 ,画出n个样品在二维平面上的分布况 ,由图形可直观地看出各样品在主分量中的地位 ,进而还可以对样本进行分类处理 ,可以由图形发现远离大多数样本点的离群点。 4由主成分分析法构造回归模型。即把各主成分作为新自变量代替原来自变量x做回归分析。 5用主成分分析筛选回归变量。回归变量的选择有着重的实际意义 ,为了使模型本身易于做结构分析、控制和预报 ,好从原始变量所构成的子集合中选择最佳变量 ,构成最佳变量集合。用主成分分析筛选变量 ,可以用较少的计算量来选择量 ,获得选择最佳变量子集合的效果。 编辑主成分分析法的计算步骤 1、原始指

      6、标数据的标准化采集p 维随机向量x = (x1,X2,.,Xp)T)n 个样品xi = (xi1,xi2,.,xip)T ,i=1,2,n , np ,构造样本阵 ,对样本阵元进行如下标准化变换: 其中 ,得标准化阵Z。 2、对标准化阵Z 求相关系数矩阵 其中, 。 3、解样本相关矩阵R 的特征方程得p 个特征根,确定主成分 按 确定m 值 ,使信息的利用率达85%以上 ,对每个j, j=1,2,.,m, 解方程组Rb = jb得单位特征向量 。 4、将标准化后的指标变量转换为主成分 U1称为第一主成分,U2 称为第二主成分,Up 称为第p 主成分。 5 、对m 个主成分进行综合评价 对m 个主成分进行加权求和 ,即得最终评价值 ,权数为每个主成分的方差贡献率。 编辑主成分分析法的应用分析编辑案例一:主成分分析法在啤酒风味评价分析中的应用1啤酒是个多指标风味食品, 为了全面了解啤酒的风味, 啤酒企业开发了大量的检测方法用于分析啤酒的指标, 但是面对大量的指标数据, 大多数企业又感到茫然,不知道如何利用这些大量的数据, 由上面的介绍可知,在这种情况下,主成分分析法能够派上用场。近年来,科

      7、研人员为了获得对啤酒风味更好的理解, 多元统计技术的使用越来越多。这主要有以下两方面的原因:在啤酒领域里, 几乎没有一个问题能够使用单变量(单指标)就能反映事物的属性, 例如啤酒的好坏、一致性, 不能通过双乙酰一个指标说明问题;另一个重要的原因就是, 近年来大量数学统计软件的不断出现和个人电脑的普及促进了多元统计分析技术的应用。多元统计技术在啤酒风味研究中的一个重要任务就是找出啤酒风格和啤酒理化指标(风味成分指标也属于理化指标)之间的相关性。例如可以用多元统计技术来找出啤酒的风味指标和啤酒风味的关系或不同啤酒的风味差异性。 经常使用的多元统计技术有聚类分析、判别分析、主成分分析和回归分析等。其中主成分分析能够用于多指标产品, 主成分分析可以按照事物的相似性区分产品, 结果可用一维、二维或三维平面坐标图标示, 特别直观。使用主成分分析法可以研究隐藏在不同变量背后的关系,而且根据这些变量能够获得主成分的背景解释。 鉴于主成分分析在啤酒风味质量应用中的强大作用, 本文简单介绍主成分分析的基本原理及其在啤酒一致性监控中的应用,以引起我国啤酒同行的广泛关注。 编辑1 材料与方法1.1 仪器 HP

      8、 6890 毛细管气相色谱仪 (美国安捷伦公司),FID 检测器, HP 7694E 顶空自动进样器, HP 气相色谱化学工作站。 1.2 分析方法 1.2.1 样品制备 啤酒于5 冷藏, 量取 5 mL 酒液于 20 mL 顶空瓶中, 添加2.0 g/L 正丁醇溶液 0.10 mL, 加密封垫及铝盖密封,振荡混匀以供顶空气相色谱测定。 1.2.2 色谱条件 毛细管色谱柱 (DB- WAXETR 30 m0.53 mm i.d,膜厚1.0 m);柱温:起始温度为 35 , 以 10 /min 程序升温至150 , 再以 20 /min 升温到180 , 并继续恒温5 min;进样口温度 150 ; 检测器温度 200 ; 载气为高纯氮气, 流速为5 mL/min;氢气 30 mL/min;空气400 mL/min;采用分流进样,分流比为11。 编辑2 主成分分析法的基本原理2.1 主成分分析法在啤酒研究中应用的必要性这里通过一个例子说明, 主成分分析在啤酒研究中的必要性。假如有6 个啤酒样品,分别标为A- F,每个啤酒样品用3 个指标来描述。这些指标可以是仪器的分析数据、感官分析数据或

      9、两者都用。为了便于讨论,假设这3 个指标分别为苦味值(BU)、DMS和酒精浓度。为了解这6 个样品两两之间的相似性, 便于将这6 个样品进行分类,可以把这6 个样品画在三维空间中,见图1。显然在这个简单的例子中, 这6 个样品倾向于形成两类, 即分别是A- C 和 D- F。通过所测的指标可以解释这种分类, 例如, 第一组(A- C)有较高的苦味值和较低的酒精浓度。这个例子中只涉及到6 个样品和3 个指标。但是实际上, 样品数量和指标数量都会很大, 例如, 有20 个指标, 这时, 样品不能在20 维的坐标系中画出。为了解决多指标的样品的比较问题,可以使用主成分分析法。 2.2 主成分分析法的基本原理 主成分分析的第一步是将所有的指标数据进行标准化, 标准化的一般方法为: (xij xjmean) / j, 这里xij是样品j 的第 i 个指标, xjmean 和 j是第j 个指标的平均值和标准偏差, 通过标准化后, 每个变量的平均值变成0,标准偏差为1。标准化的好处是可以消除不同指标间的量纲差异和数量级间的差异。 第二步求出指标间的相关矩阵, 通过相关矩阵, 可以确定具有高度相关性的指标, 这些指标间的协方差可以通过另一个变量替代, 这个变量叫作第一成分。去掉第一成分后, 计算残留相关阵, 通过残留相关阵, 第二组高度相关的变量也可以发现, 它们的协方差可以用第二成分替代, 第二成分和第一成分是正交的。第二成分对原始数据的贡献去除后, 可以提取第三成分。此过程一直继续, 直到原始数据的

      《主成分分析法概念及例题[文]》由会员瑶***分享,可在线阅读,更多相关《主成分分析法概念及例题[文]》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.