好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

聚类分析方法应用举例.docx

6页
  • 卖家[上传人]:公****
  • 文档编号:426388127
  • 上传时间:2023-07-11
  • 文档格式:DOCX
  • 文档大小:68.10KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 刘向民 物流工程 S11085240007 聚类分析方法应用举例多元统计,是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学 科多元统计所包括的内容很多.但在实际统计分析中,聚类分析是应用最广泛的方法之一 聚类分析(cluste:Analysis),是研究分类问题的一种多元统计分析方法社会经济统计的分类问 题,过去在传统方法上,主要是结合一定的专业知识进行定性分类处理由于定性分类主要 是靠经验完成,因而其结论难免带有较多的主观性和随意性,故不能很好地揭示客观事物内 在的本质差别和联系而聚类分析能带来定量上的分析可以解决这个问题,下面通过一些实 例来描述聚类分析方法在应用上的体现;1 基于聚类分析的安徽省物流需求研究选取了分行业统计的年产值类指标构建物流需求指标体系(X组),具体指标包括:农 业总产值(万元)(XI)、工业总产值(亿元)(X2)、建筑业总产值(万元)(X3)、社会消 费零售总额(万元)(X4)、亿元商品市场成交额(万元)(X5)、进出口总额(万美元)(X6) 该指标体系通过农业、工业、建筑业、批发业、零售业及国际贸易的发生额较全面地反映了 地区的物流需求情况。

      附件:数据表(来涯F安谨若富)0&统计乍鉴}农5射流■石求衍标悴柬難堀城市底卅总产tfi(万由(XL)1.业总产tfi建筑业总产恒社合消费#售 总舐〔丹元)CX4)亿元商iUi市场 成童舐UJ A ) g进.'JJ1J总觀 t厅英元)音肥1 383 514.91 4W.L46 I6S 8264 6S0 0234 m fits4«7 555淮北453 5423298.03330 651727 449148 9085 362曙州1 763 918-4138.52§4 fifiS1 312 356625 7354 L怡宿州2 42 1 752.fi2I9.5L636 )021 148 肿 704 IJ6算埠1 343 280.9327.4S802 0591 562 442135 43527 4392 606 764.7542 1981 927 370574 4LfiL L 2354如 452®34637L 173 挪41 网 1X1勢4S77 858柠州1 743 OM94無94551 0271 262 378336 13039 553安1 894 152.6315.6466(1 5591 609 74776 10720 0^7马林山317 4L2.L制4 373865 255320 1702Lfi 4f)21 596 563.6378.07399 S471 219 662237 52317 942593 658.5930.601 134 2961 658 33923© 4M筋973宜城1 035 853.9439.4A331 打 54L L44 2703H6 6912fiffiK127 725.4586.52333 010571 649725 543220 136池州552 169.5l$2 9S5536 4肿16 6(107 36^L 沁 11^.6607.18713 5011 980 6631 772 8552fi 221虞山528 5^4.7151.25240 607731 0L40L2俪2 研究方法分类问题一般的解决法是聚类分析或者因子分析基础上的聚类分析。

      由于本文最终期望 得安徽省地级市物流需求分类情况,无需了解各个指标体系的内在系统结构,故选择聚类分 析方法更简明进行聚类分析时,本文采用的是基于样本聚类的Q型系统聚类方法3 研究过程和结果3.1 地区物流需求指标的聚类分析由分析软件输出的聚类过程统计量如表1所示可以看出,伪F统计量在归为4类及7类区肥北州山南州埠州湖安城州阳庆山陵湖O 地合淮池黄淮亳蚌滁巢六宣宿阜安鞍铜芜时较大,说明归为4类及7类时较好;伪T2统计量在1类、2类、3类时较大,由于伪T2 大说明上一次归类效果较好,所以归为4类、3类、2类效果较好而R2的值在由4类归 为3类、由3类归为2类以及由2类归为1类时都有较大的减小,说明归类为2类、 3类和 4类都是比较好的半偏R2统计量的值越大,则上一步聚类效果更好,所以归为4类、3 类、 2类效果都较好综合考虑四个统计量的值,并考虑分类的实用性,本文认为归为4类 比较合适聚类图见图1表1用类平均法对地区物流需求类指标聚类的输出统计量统计量样品被合并的类数1类2类3类4类5类6类7类Pseudo F (伪 F)27.600025.600035.300032.400031.700040.5000Pseudo T2 (伪 I4)27.60008.900013.70003.40003.80006」0002.5000RSQ (R2)0.00000.64800.78500.89100.91500.93500.9600SPRSQ (半倔 R2)0.64790.13730.10540.02480.01970.02550.00760.25 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50Average Dstance Between Austers图1类平均法的地区物流需求聚类图由软件分析得的聚类过程得到每一类的各个指标的平均值如表2所示。

      可以看出,四类地区 的区分明显,各种产值指标依次递减依据四类地区物流需求情况可将安徽省的17个地级 市分为物流需求旺盛的省会经济圈、需求较大的马铜芜地区;物流需求量小的两淮和皖南山 物流需求量小的两淮和皖南山区以及物流需求较小的第三类地区表2类平均法对物流需求指标分为4类的结果及每一类的各指标平均情况类别第一类第:类第「类第四类该类所包含的地区合肥马鞍山铜陵芜湖滁州巢湖六安 蚌埠宿州阜阳 亳州近城安庆池州黄山 淮北淮南XI农业总产值(万元)1 383 514.90346 265.331 814 164.84508 439.85X2I业总产值(亿元)1 493,14790.54351.60221.06X3建筑业总产值(万元)6 168 826.00777 22633525 736.89484 409.25X4社会消费零售总额(万元)46 900 230.001 031 747.671 462 998.33771 263.25X5亿元商品市场成交额(万元)4 888 615.00428 391.00451 654.6751 248.75X6进出口总额(万美元)487 555.00174 523.6720 097.678 213.752 聚类分析在证券投资基本分析中的应用附表 上市公司粽合评价指标体系指标类型盈利能力偿债能力资产管理能力指标名称上营业务利润率每股收益资产负债率流动比率速动比率总资产周转率存货周转率设将〃支股票分成2类e, G2, 用表示G中的第i支股票,M表示G,中的股票个数,石0是G的重心,则G中的股票离差平方和是:St = X娜 一 ― X~(^t))a三I股本扩张能力每股净资产每股公积金主彗业峯讎日日產力个类的离差平方和为;t 叫s=另厲-币丿m石“丿 i= I I当*固定时,要选择使S达到最小值的分类结果•假设类G„和类Gq合并成新类Gr,则G与任一类Gk之间的距离递推公式为:n2 _ /V AT “ " n, "AT "5, _吐 2 Ukr= Nr+ Nk * Nr+ NkUkq~ Nr+ Nk pq有相关数据,聚类分析与结论;应用SPSS软件对31支股票进行系统聚类分析,由聚类分析的结果将这31支股票大致可以 分成 6 类:第 1 类:合金投资(18)、四川双马(19),第2 类:厦新电子(3)、数源科技(22)、清华同 方(1)、皖维高新(15)、哈药集团(14);第3类:乐凯胶片(11)、中原油气(29)、辽河油田(21)、 盐田港(23);第 4 类:王府井(9)、深信泰丰(17)、上海机场(13)、中集集团(24)、西山煤电(26)、 中兴通讯(28)、神火股份(30);第 5 类:波导股份(10)、鞍钢新轧(25)、伊利股份(4)、宝钢股 份(12)、燕京啤酒(2)、隆平高科(27);第 6类:方正科技(6)、长安汽车(31)、太极集团(5)、 青岛啤酒(16)、深康佳(20)、东软股份(7)、中国联通(8)。

      3 我国区域可持续发展的聚类分析应用举例1可持续发展指标体系由此根据中国科学院设计町持续发展扌旨标体系并结合本文的特点耳设计的指标体系如图L图1区域可持续发展指标体系—■- LI1" r * W ** r h 、 B ■ ■ •■严p I jr r /frv. - 4 ・ h X*議J部分地区可持续发展支持录统指标柿地区电存支持系坑爰展支持菇统环境支持乘统社会支持系貌智力支持系蝶r东50.OS64,1051.8056.6356.00嬲北41.4442.8547.3053.29M82廿肃30.8830.023S.&431-6438.60山西316430.653X5848.2640.94上海59.8478.215J.6183-7567.36于夏36-9228-5832®34.1439.56洞南4他42,9047.8544.0942.21湖南42J239.075L0143.9243.09天律51 5363.5851.9970.1856.57北用52.6168.2246.3790.1674.47河北43.7545.9440.5250.8847.22内蒙古35.4333.3841.9247.4141.50正宁46 9648.5845.0562.S65L99吉林50 JI39.87473360.51 *46.6644.79443153.4256.4544.392 聚类分析的基本步骤 相关公式定理1)为使数据能放在一起进行比校卡须对数据进 行变换处理.在分析的过程中,对数据进行标准变 换,即⑷1.'2\- = -\T X< (i=U 叫尸 I, 2, ■■■, m)英中兮+列w = min © D2)开始时每个样品口成一类,忍为其距离、设类 &与G』之间非0的最小距离为0叶D 称作距离矩阵,注意血=0, %>山。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.