01-SPSS软件聚类分析过程的图文解释及结果的全面分析.docx
13页SPSS聚类分析过程聚类的主要过程一般可分为如下四个步骤:1. 数据预处理(标准化)2. 构造关系矩阵(亲疏关系的描述)3. 聚类(根据不同方法进行分类)4. 确定最佳分类(类别数)SPSS软件聚类步骤1. 数据预处理(标准化)->Analyze(分析)—Classify份类,归类)THierachicalClusterAnalysis层序聚类分析)—Method(方法,条理,)然后从对话框中进行如下选择从TransformValues框中点击向下箭头,此为标准化方法,将出现如下可选项,从中选一即可:Range0to1Maximummagnitudeof1Meanof1Standarddeviationof1标准化方法解释:None:不进行标准化,这是系统默认值;ZScores(Z-Scores,英文名又叫StandardizedPopulationData是以标准差单位来表现的一组观察值):标准化变换;Range—1to1:极差标准化变换(作用:变换后的数据均值为0极差为1,且消去了量纲的影响;在以后的分析计算中可以减少误差的产生Range0to1(极差正规化变换/规格化变换);2. 构造关系矩阵在SPSS中如何选择测度(相似性统计量):—Analyze—ClassifyTHierachicalClusterAnalysis—Method然后从对话框中进行如下选择常用测度(选项说明):Euclideandistance:欧氏距离(二阶Minkowski距离),用途:聚类分析中用得最广泛的距离;SquaredEucideandistance:平方欧氏距离;Cosine:夹角余弦(相似性测度;Pearsoncorrelation:皮尔逊相关系数;3. 选择聚类方法SPSS中如何选择系统聚类法常用系统聚类方法a)Between-groupslinkage组间平均距离连接法方法简述:合并两类的结果使所有的两两项对之间的平均距离最小。
项对的两成员分属不同类)特点:非最大距离,也非最小距离b)Within-groupslinkage组内平均连接法方法简述:两类合并为一类后,合并后的类中所有项之间的平均距离最小C)Nearestneighbor最近邻法(最短距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法d)Furthestneighbor最远邻法(最长距离法)方法简述:用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法e)Centroidclustering重心聚类法方法简述:两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值特点:该距离随聚类地进行不断缩小该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦f)Medianclustering中位数法方法简述:两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离特点:图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用g)Ward'smethod离差平方和法方法简述:基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大特点:实际应用中分类效果较好,应用较广;要求样品间的距离必须是欧氏距离。
谱系分类的确定经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:A. 任何类都必须在临近各类中是突出的,即各类重心间距离必须极大B. 确定的类中,各类所包含的元素都不要过分地多C. 分类的数目必须符合实用目的D. 若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类实例分析生成树形图生成冰柱图中Qerpdrcgranicicle 在“分群"单选框中选中“个案”,表示进行的是Q型聚类在“输出"复选框中选中“统计量”和“图”,表示要输出的结果包含以上两项单击“统计量(S)”按钮,在“系统聚类分析:统计量”对话框中选择“合并进程表”、“相似性矩阵”,如图6所示,表示输出结果将包括这两项内容单击“绘制(T)”按钮,在“系统聚类分析:图”对话框中选择“树状图”、“冰柱”,如图7所示,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)单击“方法(M)”按钮,弹出“系统聚类分析:方法対话框,如下图8所示S垂統聚类分析:方法■聚类方法组间联接度里标准转换值「转换度重标准化国:”门■I◎按照变里①}◎按个案:绝对值<y更改符号重新标度到o-i全距匡)司[取消][帮助"聚类方法(M)”选项条中可选项包括如图-9所示的几种方法,本例中选择"组间联接”:"度量标准-区间(N)”选项条中可选项包括如图-10所示的几种度量方法,本例中选择"平方Euclidean距离”:度里标:隹@区间迥宰方Euclidean5^离VEuclidean距离平方Euclidean距离◎计數①:金弦©二分类电):Pearson相关性Chebychev距离1块Minkowski距离「转换值设定距离"转换值-标准化(S)"选项条中可选项包括如图-11所示的几种将原始数据标准化的方法,本例中选择“全局从0到1”:转换值标准化®):全距就0到iV无z得分全距就-1到1全距就。 到11的最大重均值为1):标准差为1冰柱图解释横轴:案例(Case)表示被聚类的对象或变量;纵轴:群集数(Numberofclusters)表示被聚成几类;观察冰柱图应从最后一行开始举例如下:当聚成6类时X4和X8和X6聚成一类,其他个案自成一类,用白板将6类一下挡上可以看出如图;当聚成5类时X4和X8和X6和X2聚成一类,其他个案自成一类冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形象;缺点是不能表现出聚类过程中距离的大小若生成的树状图如下,看不清楚可点击右键导出文件,生成word文件,然后可以看出聚类过程导出的word文档中聚类过程如下:Rescs.leiEistanzeClusterConbiaeCASEU510lb2ULibelNLJIL十B---4C3-++---———一A14-+E5——+————一1Fb——+1D4+可看出聚类过程为如下表所示:分类过程统计表连结顺序连结元素1BC2ABC3EF4EFABC5DABCEF。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


