电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

多元统计学DOC

  • 资源ID:91083981       资源大小:516KB        全文页数:9页
  • 资源格式: DOC        下载积分:15金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要15金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

多元统计学DOC

利用主成分分析法对废水污染物进行分析摘要:主成分分析法是统计学中常用的统计分析方法,主要是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标.此文中我们利用SPSS软件对主要城市的废水污染物的排放情况,通过主成分分析的方法进行统计分析,进而再通过聚类,根据主要城市的废水污染物对城市进行分类.关键字:主成分分析,聚类,废水污染物,SPSSAbstract: Principal component analysis is a statistical method commonly used in the statistical analysis, which makes many indexes be less ones with a few information lost. In this paper, we use SPSS software for wastewater pollutant emissions in major cities, applying statistical analysis by using principal component analysis, and then clustering cities into several groups according to the city's main water pollutants.Key Words: Principal component analysis, Clustering, Wastewater pollutants, SPSS1引言主成分分析(principal component analysis)也称主分量分析,由霍特林( Hotelling )于1933年首先提出.主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法.通常把转化后的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能.这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率.由于主成分分析的这些优势,在实际问题中遇到指标较多且各指标相关关系较大时,人们常考虑应用主成分分析的方法.河流中污染物的含量一直是环境资源问题的研究热点,本文正是通过多元统计学中的主成分分析的分析方法来对废水中的污染物的排放情况进行分析,然后通过聚类分析对这些主要城市进行分类.2. 基本原理2.1主成分分析的基本原理在对某一事物进行实例研究中,为了更全面的、更准确地反应事物的特征及其发展规律,人们往往要考虑其有关系的多个指标,一方面人们为了避免遗漏重要的信息而考虑尽可能多的指标,而另一方面随着考虑指标的增多增加了问题的复杂性.由于各指标是对同一事物的反映,不可避免地造成信息地大量重叠,基于此,主成分分析研究通过原来变量地少数几个线性组合来反应原理指标的信息,相互之间又尽可能不含重复信息.2.1.1 主成分的求法设总体 现在寻求新的综合指标.其基本思想是:找出个分量的一个线性组合,为使尽可能的反映的变化情况,就是要使具有最大的方差.继而找出的各分量的第二个线性组合,为使和相互之间尽可能不含重复信息,又能尽可能多的反映的信息,就要是在与不相关的条件下具有最大的方差,如此继续下去,直到的信息基本提取完毕为止.这些新的综合指标,等就称为的主成分.由协方差阵是一个非负定矩阵,现在寻求使得的方差达到最大,且.这是一个条件极值问题:利用拉格朗日乘数法,令得,可见是长度为1的特征值.此时,所以应取为的最大特征根,且应取为相应于的单位化的特征向量,因此为的第一主成分.同样要求达到最大,其中且,问题归结为求解与前面类似,求得应取为相应于的第二大特征根所对应的单位特征向量,从而求得的第二主成分.以此类推,求得的k个主成分.2.1.2 主成分求解步骤(1) 求的协方差阵的特征根,记为(2) 求对应的单位特征向量(因为对称阵,故不同特征根对应的特征向量比正交).(3) 取即为的第个主成分,.注意,若,则可得的个主成分,当有重根时,主成分不惟一.值得注意的是,的主成分是由的分量的特殊线性组合而得,如果各分量的单位(即量纲)不同,那么这种线性组合要解释其含义就很困难了,而且当某一个变量改变其计算单位后,协方差阵就会改变,自然相应的的特征根、特征向量也随之改变,最后导致主成分的改变.为了清除变量间不同单位的影响,通常是先把各变量标准化,即坐如下变换,令其中,.注意到的协方差阵实际上是的相关矩阵,即,其中,为变量与的相关系数.对实行求主成分的步骤(1)(3),所得的主成分成为标准主成分.需要指出的是,从和分别算出的主成分有时有很大的不同,这意味着变量的标准化并不是无关紧要的.一般来说,当变量取值范围彼此差异很大或度量单位不同时,应考虑标准化,不过当的主对角线上的各元素相差不大时,为了简单,也可以直接求的主成分进行分析.在实际问题中,所研究的总体的均值、协方差阵和相关矩阵大多是未知的,所以这时我们应以样本观测阵中的数据,求出它们的样本均值、样本协方差阵和样本相关矩阵,再根据相应的计算运用主成分分析法求解出样本主成分.2.1.3 贡献率和主成分的实际意义主成分分析的目的之一,是用可能少的不相关的主成分来代替个相关变量 ,且能描述的统计特征,并对的实际意义作出合理解释.以下以表示的协方差阵,记那么中主对角线上的元素分别表示的各分量的方差,因而的“总方差”为对于非负定矩阵,有,而的“总方差”为,从而有,.上式说明的“总方差”等于的“总方差”,其中具有最大的方差,次之具有方差,具有最小的方差,为此表明了主成分的方差在全部方差中的比值,则称第个主成分的贡献率.这个值越大,表明综合反映的能力越强,反之越弱.则称为前m个主成分的累计贡献率.在实际应用中常略去那些贡献率小的主成分.相关经验指出,一般来说,若这m个主成分的方差已占“总方差”的85%以上,则只需这m个主成分就够了.当然这并不是一个绝对不变的标准,要根据实际效果做取舍.2.2 聚类分析聚类分析是研究物以类聚的一种方法.分类问题在科学研究、生产实践、社会生活中到处存在,人们可以依靠相关经验和专业知识对事物实现分类,但当反映实物的性质、特性的指标较多,且对分类要求较高时,仅凭经验和专业知识就不能达到确切的分类目的.用聚类分析解决实际问题时,我们总把每个分类对象称为样品,并根据对象的性质和分类的目的选定若干指标,对每一个样品测出所有的指标值,将得到的结果列成一个数据矩阵,这个样本资料阵就是聚类分析的出发点,然后根据相应的聚类方法对样本进行聚类分析.3. 实例分析3.1 数据选取本文所选取的数据来自中国统计年鉴2013中2012年主要城市废水中主要污染物的排放情况.表1:2012年主要城市废水中主要污染物的排放情况编号城市化学需氧量(万吨)氨氮(万吨)石油类(吨)铅(千克)镉(千克)砷(千克)六价铬(千克)1北 京18.652.0551.46215.9117.9021.34325.842天 津22.942.54138.211004.649.6419.37169.283石 家 庄22.911.57147.5815.170.911.523.694太 原2.580.4627.7791.2113.3332.48154.655呼和浩特13.240.481.517.542.006沈 阳26.052.2560.5239.531.091.4487.057长 春18.331.3926.3615.480.030.0888.468哈 尔 滨31.472.2838.4220.801.0141.489上 海24.264.74649.74321.2515.3499.861010.9710南 京10.891.75204.2720.328.9551.79328.7111杭 州10.481.3840.6332.340.311.002318.1412合 肥12.531.0925.2120.032.702.856.6913福 州10.681.5926.0427.492.477.01454.4414南 昌8.871.1276.7751.638.585.1616869.5915济 南11.580.9678.006.571.5443.2585.9916郑 州9.811.30177.8220.726.1927.2944.0617武 汉15.911.86111.50122.894.30209.461193.8418长 沙12.301.3914.7863.9911.571.98133.0919广 州17.912.3994.71105.9815.4032.171669.5520南 宁12.371.326.3516.913.6624.0917.2521海 口1.690.463.320.280.110.470.0022重 庆40.285.34354.4888.432.651362.39204.8423成 都19.842.3034.9116.322.3197.70100.1724贵 阳4.360.5160.962.710.880.703.7925昆 明2.820.7276.364933.121063.343641.000.4526拉 萨0.990.120.272.570.5127西 安11.831.38273.3749.215.738.2493.5828兰 州4.960.8669.028.741.242.972.0529西 宁4.290.4638.83291.5878.37209.627.2630银 川5.100.6553.5711.030.3136.976.7431乌鲁木齐3.130.6355.8428.2142.46122.08129.583.2 主成分分析在spss中的具体操作步骤运用SPSS统计软件的分析过程,对31个主要城市废水中主要的污染物的排放情况进行主成分分析,具体步骤为:1. 分析-描述-数据标准化,选中7个原始指标,并在对话框中勾选将标准化后的数据存在变量;2. 分析-降维-因子分析,弹出因子分析对话框;

注意事项

本文(多元统计学DOC)为本站会员(206****923)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.