好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第十章 spss聚类分析.docx

19页
  • 卖家[上传人]:桔****
  • 文档编号:460399334
  • 上传时间:2022-09-26
  • 文档格式:DOCX
  • 文档大小:438.33KB
  • / 19 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第十章 聚类分析第一节 K-Means Clus ter 过程10.1.1主要功能10.1.2实例操作第二节 Hierarchical Clus ter 过程10.2.1主要功能10.2.2实例操作第三节 Discriminant 过程10.3.1主要功能10.3.2实例操作人们认识事物时往往先把被认识的对象进行分类,以便寻找其中同与不同的特征,因而 分类学是人们认识世界的基础科学在医学实践中也经常需要做分类的工作,如根据病人的 一系列症状、体征和生化检查的结果,判断病人所患疾病的类型;或对一系列检查方法及其 结果,将之划分成某几种方法适合用于甲类病的检查,另几种方法适合用于乙类病的检查; 等等统计学中常用的分类统计方法主要是聚类分析与判别分析聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归 入不同的类判别分析则先根据已知类别的事物的性质,利用某种技术建立函数式,然后对 未知类别的新事物进行判断以将之归入已知的类别中聚类分析与判别分析有很大的不同, 聚类分析事先并不知道对象类别的面貌,甚至连共有几个类别也不确定;判别分析事先已知 对象的类别和类别数,它正是从这样的情形下总结出分类方法,用于对新对象的分类。

      第一节 K-Means Cluster 过程10.1.1 主要功能调用此过程可完成由用户指定类别数的大样本资料的逐步聚类分析所谓逐步聚类分析 就是先把被聚对象进行初始分类,然后逐步调整,得到最终分类10.1.2 实例操作[例10.1 ]为研究儿童生长发育的分期,调查1253名1月至7岁儿童的身高(cm)、 体重(kg)、胸围(cm)和坐高(cm)资料资料作如下整理:先把1月至7岁划成19 个月份段,分月份算出各指标的平均值,将第 1 月的各指标平均值与出生时的各指标平均值 比较,求出月平均增长率(%),然后第2月起的各月份指标平均值均与前一月比较,亦求 出月平均增长率(%),结果见下表欲将儿童生长发育分为四期,故指定聚类的类别数为4,请通过聚类分析确定四个儿童生长发育期的起止区间月份月平均增长率(%)身高体重胸围坐高111.0350.3011.8111.2725.4719.305.207.1833.589.853.142.1142.014.171.471.5862.135.651.042.1182.061.740.171.57101.632.041.041.46121.171.600.890.76151.032.340.530.89180.691.330.480.58240.771.410.520.42300.591.250.300.14360.651.190.490.38420.510.930.160.25480.731.130.350.55540.530.820.160.34600.360.520.190.21660.521.030.300.55720.340.490.180.1610.1.2.1 数据准备激活数据管理窗口,定义变量名:虽然月份分组不作分析变量,但为了更直观地了解聚 类结果,也将之输入数据库,其变量名为mon th;身高、体重、胸围和坐高的变量名分别为 xl、x2、x3和x4,输入原始数额。

      10.1.2.2 统计分析激活 Statistics 菜单选 Classify 中的 K-Means Cluster…项,弹出 K-Means Cluster Analysis 对话框(如图10.1示)从对话框左侧的变量列表中选x1、x2、x3、x4,点击 钮使之进 入 Variables 框;在 Number of Clusters (即聚类分析的类别数)处输入需要聚合的组数,本 例为4;在聚类方法上有两种:Iterate and classify指先定初始类别中心点,而后按K-means 算法作叠代分类, Classify only 指仅按初始类别中心点分类,本例选用前一方法为在原始数据库中逐一显示分类结果,点击 Save...钮弹出 K-Means Cluster:Save New Variables 对话框,选择 Cluster membership 项,点击 Continue 钮返回 K-Means Cluster Analysis 对话框本例还要求对聚类结果进行方差分析,故点击Options...钮弹出K-Means Cluster来 Options 对话框,在 Statistics 栏中选择 ANOVA table项,点击 Continue 钮返回 K-Means Cluster Analysis对话框,再点击OK钮即完成分析。

      10.1.2.3 结果解释 在结果输出窗口中将看到如下统计数据: 首先系统根据用户的指定,按 4类聚合确定初始聚类的各变量中心点,未经 K-means 算法叠代,其类别间距离并非最优;经叠代运算后类别间各变量中心值得到修正Initial Cluster Centers.ClusterX1X2X3X4111.030050.300011.810011.270025.470019.30005.20007.180033.58009.85003.14002.11004.3400.4900.1800.1600Convergence achieved due to no or small distance change.The maximum distance by which any center has changed is .0000Current iteration is 2Minimum distance between initial centers is 10.5200Iteration Change in Cluster Centers12341.0000.00002.46E+001.27E+002.0000.0000.0000.0000Case listing of Cluster membership.Distances between Final Cluster Centers.Cluster12341.0000232.4397.0000345.340013.2521.0000452.232520.09246.9273.0000之后对聚类结果的类别间距离进行方差分析,方差分析表明,类别间距离差异的概率值 均<0.001,即聚类效果好。

      这样,原有19 类(即原有的19 个月份分组)聚合成4 类,第一 类含原有1类,第二类含原有1类,第三类含原有2类,第四类含原有 15类具体结果系 统以变量名 QCL_1 存于原始数据库中Analysis of Variance.Error MS DFF ProbVariable Cluster MS DFX137.58063.36915.0101.7853.000X2817.116431.35415.0603.2588.000X345.40893.28115.0161.1145.000X446.09943.23515.0195.4933.000Number of Cases in each Cluster.Clusterunweighted casesweighted cases11.01.021.01.032.02.0415.015.0Missing0Valid cases19.019.0Variable Saved into Working File.QCL_1 (Cluster Number)在原始数据库(图10.2)中,我们可清楚地看到聚类结果;参照专业知识,将儿童生长 发育分期定为:第一期,出生后至满月,增长率最高;第二期,第 2 个月起至第3 个月,增长率次之;第三期,第 3 个月起至第8 个月,增长率减缓; 第四期,第 8 个月后,增长率显著减缓。

      第二节 H10.2.1主要调用此过程可完成系统聚类分析在系统聚类分析中,用户事先无法确定类别数,系统 将所有例数均调入内存,且可执行不同的聚类算法系统聚类分析有两种形式,一是对研究 对象本身进行分类,称为Q型举类;另一是对研究对象的观察指标进行分类,称为R型聚类10.2.2 实例操作[例10.2] 29名儿童的血红蛋白(g/100ml)与微量元素(“g/100ml)测定结果如下表 由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表 性指标,以便更经济快捷地评价儿童的营养状态钙X1铁X3锰X4铜X5154.830.86448.700.0121.0102942.61467.300.0081.640372.452.86425.610.0041.2204939.18469.800.0051.220553.837.67456.550.0121.0106126.18395.780.0010.594764.730.86448.700.0121.0108443.79440.130.0171.770958.838.20394.400.0011.14010034.23405.600.0081.3001143.637.35446.000.0221.38012733.67383.200.0010.9141354.840.01416.700.0121.35014940.12430.800.0001.2001586.133.02445.800.0120.91816236.81409.800.0121.1901760.335.07384.100.0000.85318530.53342.900.0180.9241954.027.14326.290.0040.81720436.18388.540.0241.0202161.225.43331.100.0120.89722329.2。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.