电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

多元统计学DOC

9页
  • 卖家[上传人]:206****923
  • 文档编号:91083981
  • 上传时间:2019-06-21
  • 文档格式:DOC
  • 文档大小:516KB
  • / 9 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、利用主成分分析法对废水污染物进行分析摘要:主成分分析法是统计学中常用的统计分析方法,主要是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标.此文中我们利用SPSS软件对主要城市的废水污染物的排放情况,通过主成分分析的方法进行统计分析,进而再通过聚类,根据主要城市的废水污染物对城市进行分类.关键字:主成分分析,聚类,废水污染物,SPSSAbstract: Principal component analysis is a statistical method commonly used in the statistical analysis, which makes many indexes be less ones with a few information lost. In this paper, we use SPSS software for wastewater pollutant emissions in major cities, applying statistical analysis by using principal component ana

      2、lysis, and then clustering cities into several groups according to the citys main water pollutants.Key Words: Principal component analysis, Clustering, Wastewater pollutants, SPSS1引言主成分分析(principal component analysis)也称主分量分析,由霍特林( Hotelling )于1933年首先提出.主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法.通常把转化后的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能.这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率.由于主成分分析的这些优势,在实际问题中遇到指标较多且各指标相关关系较大时,人们常考虑应用主成分分析

      3、的方法.河流中污染物的含量一直是环境资源问题的研究热点,本文正是通过多元统计学中的主成分分析的分析方法来对废水中的污染物的排放情况进行分析,然后通过聚类分析对这些主要城市进行分类.2. 基本原理2.1主成分分析的基本原理在对某一事物进行实例研究中,为了更全面的、更准确地反应事物的特征及其发展规律,人们往往要考虑其有关系的多个指标,一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性.由于各指标是对同一事物的反映,不可避免地造成信息地大量重叠,基于此,主成分分析研究通过原来变量地少数几个线性组合来反应原理指标的信息,相互之间又尽可能不含重复信息.2.1.1 主成分的求法设总体 现在寻求新的综合指标.其基本思想是:找出个分量的一个线性组合,为使尽可能的反映的变化情况,就是要使具有最大的方差.继而找出的各分量的第二个线性组合,为使和相互之间尽可能不含重复信息,又能尽可能多的反映的信息,就要是在与不相关的条件下具有最大的方差,如此继续下去,直到的信息基本提取完毕为止.这些新的综合指标,等就称为的主成分.由协方差阵是一个非负定矩阵,现在寻求使得的方

      4、差达到最大,且.这是一个条件极值问题:利用拉格朗日乘数法,令得,可见是长度为1的特征值.此时,所以应取为的最大特征根,且应取为相应于的单位化的特征向量,因此为的第一主成分.同样要求达到最大,其中且,问题归结为求解与前面类似,求得应取为相应于的第二大特征根所对应的单位特征向量,从而求得的第二主成分.以此类推,求得的k个主成分.2.1.2 主成分求解步骤(1) 求的协方差阵的特征根,记为(2) 求对应的单位特征向量(因为对称阵,故不同特征根对应的特征向量比正交).(3) 取即为的第个主成分,.注意,若,则可得的个主成分,当有重根时,主成分不惟一.值得注意的是,的主成分是由的分量的特殊线性组合而得,如果各分量的单位(即量纲)不同,那么这种线性组合要解释其含义就很困难了,而且当某一个变量改变其计算单位后,协方差阵就会改变,自然相应的的特征根、特征向量也随之改变,最后导致主成分的改变.为了清除变量间不同单位的影响,通常是先把各变量标准化,即坐如下变换,令其中,.注意到的协方差阵实际上是的相关矩阵,即,其中,为变量与的相关系数.对实行求主成分的步骤(1)(3),所得的主成分成为标准主成分.需要指出

      5、的是,从和分别算出的主成分有时有很大的不同,这意味着变量的标准化并不是无关紧要的.一般来说,当变量取值范围彼此差异很大或度量单位不同时,应考虑标准化,不过当的主对角线上的各元素相差不大时,为了简单,也可以直接求的主成分进行分析.在实际问题中,所研究的总体的均值、协方差阵和相关矩阵大多是未知的,所以这时我们应以样本观测阵中的数据,求出它们的样本均值、样本协方差阵和样本相关矩阵,再根据相应的计算运用主成分分析法求解出样本主成分.2.1.3 贡献率和主成分的实际意义主成分分析的目的之一,是用可能少的不相关的主成分来代替个相关变量 ,且能描述的统计特征,并对的实际意义作出合理解释.以下以表示的协方差阵,记那么中主对角线上的元素分别表示的各分量的方差,因而的“总方差”为对于非负定矩阵,有,而的“总方差”为,从而有,.上式说明的“总方差”等于的“总方差”,其中具有最大的方差,次之具有方差,具有最小的方差,为此表明了主成分的方差在全部方差中的比值,则称第个主成分的贡献率.这个值越大,表明综合反映的能力越强,反之越弱.则称为前m个主成分的累计贡献率.在实际应用中常略去那些贡献率小的主成分.相关经验指出

      6、,一般来说,若这m个主成分的方差已占“总方差”的85%以上,则只需这m个主成分就够了.当然这并不是一个绝对不变的标准,要根据实际效果做取舍.2.2 聚类分析聚类分析是研究物以类聚的一种方法.分类问题在科学研究、生产实践、社会生活中到处存在,人们可以依靠相关经验和专业知识对事物实现分类,但当反映实物的性质、特性的指标较多,且对分类要求较高时,仅凭经验和专业知识就不能达到确切的分类目的.用聚类分析解决实际问题时,我们总把每个分类对象称为样品,并根据对象的性质和分类的目的选定若干指标,对每一个样品测出所有的指标值,将得到的结果列成一个数据矩阵,这个样本资料阵就是聚类分析的出发点,然后根据相应的聚类方法对样本进行聚类分析.3. 实例分析3.1 数据选取本文所选取的数据来自中国统计年鉴2013中2012年主要城市废水中主要污染物的排放情况.表1:2012年主要城市废水中主要污染物的排放情况编号城市化学需氧量(万吨)氨氮(万吨)石油类(吨)铅(千克)镉(千克)砷(千克)六价铬(千克)1北 京18.652.0551.46215.9117.9021.34325.842天 津22.942.54138.2

      7、11004.649.6419.37169.283石 家 庄22.911.57147.5815.170.911.523.694太 原2.580.4627.7791.2113.3332.48154.655呼和浩特13.240.481.517.542.006沈 阳26.052.2560.5239.531.091.4487.057长 春18.331.3926.3615.480.030.0888.468哈 尔 滨31.472.2838.4220.801.0141.489上 海24.264.74649.74321.2515.3499.861010.9710南 京10.891.75204.2720.328.9551.79328.7111杭 州10.481.3840.6332.340.311.002318.1412合 肥12.531.0925.2120.032.702.856.6913福 州10.681.5926.0427.492.477.01454.4414南 昌8.871.1276.7751.638.585.1616869.5915济 南11.580.9678.006.571.5443.2585.

      8、9916郑 州9.811.30177.8220.726.1927.2944.0617武 汉15.911.86111.50122.894.30209.461193.8418长 沙12.301.3914.7863.9911.571.98133.0919广 州17.912.3994.71105.9815.4032.171669.5520南 宁12.371.326.3516.913.6624.0917.2521海 口1.690.463.320.280.110.470.0022重 庆40.285.34354.4888.432.651362.39204.8423成 都19.842.3034.9116.322.3197.70100.1724贵 阳4.360.5160.962.710.880.703.7925昆 明2.820.7276.364933.121063.343641.000.4526拉 萨0.990.120.272.570.5127西 安11.831.38273.3749.215.738.2493.5828兰 州4.960.8669.028.741.242.972.0529西 宁4.290.4638.83291.5878.37209.627.2630银 川5.100.6553.5711.030.3136.976.7431乌鲁木齐3.130.6355.8428.2142.46122.08129.583.2 主成分分析在spss中的具体操作步骤运用SPSS统计软件的分析过程,对31个主要城市废水中主要的污染物的排放情况进行主成分分析,具体步骤为:1. 分析-描述-数据标准化,选中7个原始指标,并在对话框中勾选将标准化后的数据存在变量;2. 分析-降维-因子分析,弹出因子分析对话框;

      《多元统计学DOC》由会员206****923分享,可在线阅读,更多相关《多元统计学DOC》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.