好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

SPSS软件聚类分析过程的图文解释和结果的全面分析范文.doc

12页
  • 卖家[上传人]:工****
  • 文档编号:405459842
  • 上传时间:2022-09-03
  • 文档格式:DOC
  • 文档大小:504.50KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • ...wd...SPSS聚类分析过程聚类的主要过程一般可分为如下四个步骤:1.数据预处理〔标准化〕2.构造关系矩阵〔亲疏关系的描述〕3.聚类〔根据不同方法进展分类〕4.确定最正确分类〔类别数〕SPSS软件聚类步骤1. 数据预处理〔标准化〕→Analyze(分析) →Classify (分类,归类)→Hierachical Cluster Analysis〔层序聚类分析〕 →Method〔方法,条理,〕然后从对话框中进展如下选择从Transform Values框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:标准化方法解释:None:不进展标准化,这是系统默认值;Z Scores〔Z-Scores, 英文名又叫Standardized Population Data, 是以标准差单位来表现的一组观察值〕:标准化变换;Range –1 to 1:极差标准化变换〔作用:变换后的数据均值为0,极差为1,且|xij*|<1,消去了量纲的影响;在以后的分析计算中可以减少误差的产生〕;Range 0 to 1〔极差正规化变换 / 规格化变换〕;2. 构造关系矩阵在SPSS中若何选择测度〔相似性统计量〕:→Analyze →Classify →Hierachical Cluster Analysis →Method 然后从对话框中进展如下选择常用测度〔选项说明〕:Euclidean distance:欧氏距离〔二阶Minkowski距离〕,用途:聚类分析中用得最广泛的距离;Squared Eucidean distance:平方欧氏距离;Cosine:夹角余弦(相似性测度;Pearson correlation:皮尔逊相关系数;3. 选择聚类方法SPSS中若何选择系统聚类法常用系统聚类方法a〕Between-groups linkage 组间平均距离连接法方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。

      〔项对的两成员分属不同类〕特点:非最大距离,也非最小距离b〕Within-groups linkage 组内平均连接法方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小C〕Nearest neighbor 最近邻法〔最短距离法〕方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d〕Furthest neighbor 最远邻法〔最长距离法〕方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e〕Centroid clustering 重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进展不断缩小该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦f〕Median clustering 中位数法方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用g〕Ward’s method 离差平方和法方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。

      谱系分类确实定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:A. 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大B. 确定的类中,各类所包含的元素都不要过分地多C. 分类的数目必须符合实用目的D. 假设采用几种不同的聚类方法处理,则在各自的聚类图中应发现一样的类实例分析SPSS19.0分析软件聚类分析4.2聚类分析——系统聚类法在数据编辑窗口的主菜单中选择“分析(A)〞→“分类(F)〞→“系统聚类(H)〞〔如图-4所示〕,弹出“系统聚类分析〞对话框,将“地区〞变量选入“标注个案(C)〞中,将其他变量选入“变量框〞中,如图-5所示在“分群〞单项选择框中选中“个案〞,表示进展的是Q型聚类在“输出〞复选框中选中“统计量〞和“图〞,表示要输出的结果包含以上两项单击“统计量(S)〞按钮,在“系统聚类分析:统计量〞对话框中选择“合并进程表〞、“相似性矩阵〞,如图-6所示,表示输出结果将包括这两项内容单击“绘制(T)〞按钮,在“系统聚类分析:图〞对话框中选择“树状图〞、“冰柱〞,如图-7所示,表示输出的结果将包括谱系聚类图〔树状〕以及冰柱图〔垂直〕。

      单击“方法(M)〞按钮,弹出“系统聚类分析:方法〞对话框,如以以下图-8所示聚类方法(M)〞选项条中可选项包括如图-9所示的几种方法,本例中选择“组间联接〞:“度量标准-区间(N)〞选项条中可选项包括如图-10所示的几种度量方法,本例中选择“平方Euclidean距离〞:“转换值-标准化(S)〞选项条中可选项包括如图-11所示的几种将原始数据标准化的方法,本例中选择“全局从0到1〞:冰柱图解释聚类分析冰柱图形状类似于屋檐上垂下的冰柱,因此而得名横轴:案例〔Case〕表示被聚类的对象或变量;纵轴:群集数〔Number of clusters〕表示被聚成几类;观察冰柱图应从最后一行开场举例如下:当聚成6类时X4和X8和X6聚成一类,其他个案自成一类,用白板将6类一下挡上可以看出如图;当聚成5类时X4和X8和X6和X2聚成一类,其他个案自成一类冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形象;缺点是不能表现出聚类过程中距离的大小假设生成的树状图如下,看不清楚可点击右键导出文件,生成word文件,然后可以看出聚类过程导出的word文档中聚类过程如下:可看出聚类过程为如下表所示:分类过程统计表连结顺序连 结 元 素1BC2ABC3EF4EFABC5DABCEF。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.