电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > PDF文档下载
分享到微信 分享到微博 分享到QQ空间

SPSS操作方法:聚类分析[整理]

  • 资源ID:143419399       资源大小:568.02KB        全文页数:15页
  • 资源格式: PDF        下载积分:4.9金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要4.9金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

SPSS操作方法:聚类分析[整理]

1 实验指导之一 聚类分析的 SPSS操作方法 系统聚类法 实验例 城镇居民消费水平通常用下表中的八项指标来描述。八项指标间 存在一定的线性相关。为研究城镇居民的消费结构,需将相关性强的指标归并 到一起,这实际上就是对指标聚类。 实验数据表 2001 年 30 个省。市,自治区城镇居民月平均消费数据 x 1人均粮食支出 (元人 ) x5人均衣着商品支出(元人 ) x 2人均副食支出 (元人 ) x6人均日用品支出 ( 元人 ) x3人均烟、酒、茶支出( 元人 ) x7人均燃料支出 (元人 ) x 4人均其他副食支出(元人 ) x8人均非商品支出 ( 元人 ) x 1 x 2 x 3 x 4 x 5 x 6 x 7 x8 北京 天津 河北 山西 内蒙古 辽宁 吉林 黑龙江 上海 江苏 浙江 安徽 福建 江西 山东 河南 2 湖北 湖南1323 广东 广西 海南 四川 贵州 云南 西藏 陕西 甘肃 青海 宁夏 新疆 系统聚类法的 SPSS 操作: 1. 从数据编辑窗口点击Analyze Classify Hierachical Cluster , (见图 1) 图 1 系统聚类法 打开层次聚类法对话如图2。 3 图 2 系统聚类法对话框 选择需要进行聚类分析的变量进入Variable框内后,在 Cluster栏中选择 聚类类型, SPSS 有两种层次聚类方法: Cases 对样品聚类( Q型;系统默认), Variable 对指标变量聚类 (R 型),本例选择。 在 Display 栏中选择默认的输出项。 2. 点击 Statistics按钮,打开对话框如图3. 图 3 Statistics对话框 Agglomeration schedule输出凝聚状态表(聚类进度表);本例选 择。 Ploximity matrix 输出个体间的距离矩阵,本例选择。 Cluster Membership栏中显示每个观测量被分派到的类。 None 不输出。本例选择。 Simple solution 指定分类数,并输出样本所属类,单一解。 4 Renge of solution 指定输出从 m到 n 类的各样本所属类。多个解。 选好后返回主对话框。 3. 单击 Method按钮,打开对话框如图4-1. Cluster Method :选择聚类方法: SPSS中提供 7 种聚类方法,分别是:类间平均,类内平均,最短距离,最 长距离,重心法,中值法,最小平方和法。本例选择类间平均。 Measure栏:对距离的测度方法选择 SPSS 中提供了三种类型: Interval等间距度量的变量(连续型), Counts 计数型变量(离散型)和Binary 二值变量。 Interval等间隔测度的变量方法包括: Euclidean distance欧氏距离; Squared Euclidean distance欧氏平方距离; Cosine 夹角余弦( R 型聚类); Pearson Correlation皮尔逊相关系数距离( R 型聚类),本例选择此项。 Chebychev契比雪夫距离; block 距离; Minkowski 明氏距离; Customized 用户自定义距离 - 即变量绝对值的第p 次幂之和的第 r 次 根。p 与 r 由用户指定。 5 图 4-1 Method对话框 Transform Values栏,选择消除数量级差的方法(见图4-2), 依次是: None不作处理(系统默认);本例选择此项。 Z scores 标准化处理; Range -1 to 1 各变量值除全距; Range 0 to 1各变量值减最小值后除全距; Maximum magnitude of 1各变量值除最大值; Mean of 1 各变量值除以均值; Standard deviation of 1各变量值除以标准差。 图 4-2 Method对话框 4. 单击 Plots 按钮,打开对话框如图5. 6 图 5 Plots对话框 Dendrogram 表示输出树形图,本例选择此项。 Icicle表示输出冰柱图。其中, All clusters表示输出聚类分析每个阶段的冰柱图;本例选择此项。 Specified range of cluster 表示只输出某个阶段的冰柱图,输入 从第几步开始到第几步结束,中间间隔几步。 Orientationk 栏中指定如何显示冰挂图: Vertical纵向显示,本例选择此项。 Horizontal 横向显示。 图 6 Save New Variables对话框 5. 单击 Save按钮,打开Save New Variables对话框,如图6 所示。 选择是否将聚类的结果以变量形式保存在数据文件中。变量名为:clun_m, 其中 n 表示类数, m表示第 m次分析。 Cluster Membership栏 None 不输出 Simple solution 指定分类数,并输出样本所属类。单一变量。 Renge of solution 指定输出从 m到 n 类的各样本所属类。 多个变量。 当选择结束后,在主对话框中点击OK ,可得下面的输出表和图。 7 Proximity Matrix两两变量间距离矩阵(相关系数矩阵) CaseMatrix File Input 人 均粮食 支出(元 / 人) 人 均副食 支出 ( 元 人 ) 人均 烟、酒、茶 支出 (元 人) 人均 其他副食 支出 (元 人 ) 人均 衣着商品 支出 ( 元 人 ) 人均 日用品支 出( 元 人) 人 均燃料 支出 ( 元 人 ) 人均 非商品支 出( 元 人) 人均粮食支 出(元 /人) .00 0 .33 4 .197 .34 9 .319 人均副食支 出(元人 ) .33 4 .00 0 .399.716 .41 4 .835 人均烟、酒、 茶支出 (元人 ) .000.533.497.033 人均其他副 食支出 (元人 ) .39 9 .533.000.698.478.313 人均衣着商 品支出 (元人 ) .497.698.000.284 人均日用品 支出 ( 元人 ) .19 7 .71 6 .033.478.284.000 .40 8 .710 人均燃料 支出 ( 元人 ) .34 9 .41 4 .408 .00 0 .399 人均非商品 支出 ( 元人 ) .31 9 .83 5 .313.710 .39 9 .000 Average Linkage (Between Groups) 类间平均 Agglomeration Schedule 凝聚状态进度表; St age Cluster Combined Coeffic ients Stage Cluster First Appears Next Stage Clust er 1 Clust er 2 Clust er 1 Clust er 2 128.835002 226.713105 8 345.698004 434.515037 527.407206 612.299057 713.004640 凝聚状态进度表: 第一列 (Stage) 表示聚类的进度顺序; 第二、三列(Cluster combine) 表示每一步将哪两类合并;第四列(Cofficients)表示被合并的两类之 间的距离;第五、六列 (Stage Cluster First Appares)表示被合并的两类上一 次合并分别是在哪一步形成的。0表示被合并的类为单个样品。最后一列(Next Stage) 表示每一步形成的新类将在哪一步参与下一次合并。 Vertical Icicle冰柱图 Number of clusters Case 人 均 衣 着 商 品 支 出 ( 元 人) 人 均 其 他 副 食 支 出 ( 元 人) 人 均 烟、 酒、 茶 支 出 ( 元 人) 人 均 燃 料 支 出 ( 元 人) 人 均 日 用 品 支 出 ( 元 人) 人 均 非 商 品 支 出 (元 人) 人 均 副 食 支 出 ( 元 人) 人 均 粮 食 支 出 ( 元 / 人) 1XXXXXXXXXXXXXXX 2XXXXXXXXXXXXXX 3XXXXXXXXXXXXX 4XXXXXXXXXXXX 5XXXXXXXXXXX 6XXXXXXXXXX 7XXXXXXXXX Dendrogram表示输出树形图(谱分析图) * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Average Linkage (Between Groups类间平均 ) Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +-+-+-+-+-+ X2 2 X8 8 X6 6 9 X7 7 X1 1 X4 4 X5 5 X3 3 二: K- 聚类法的具体操作 以例为例,说明快速聚类法的操作过程。 1. 在数据窗口单击 Analyze ClassifyK-Mean Cluster 打开对话框(见 图 7) 10 图 7 K-Means Cluster Analysis 对话框 将变量选入 Variables 栏; 将标识变量选入 Label Cases 栏(可省略) 将分类数输入 Number of 框(系统默认为 2),本例中选择 4. Method 栏聚类方法栏 Iterate and classify (按 K-means 算法)叠代分类(系统默认)。 Classify only 仅按初始类别中心点分类(不叠代)。 Centers 类中心数据的输入与输出(可省略) Read initial from 使用指定数据文件中的数据作为初始类中心(文件格式 参考 Write final as 文件格式) 选择 Write final as 把聚类结果中的各类中心数据保存到指定的文件。 本例中选择系统默认项。 2. 单击 Iterate按钮,打开 Iterate对话框如图 8 所示: Maximum Iterations 限定 K-Means 算法的迭代次数,系统默认 值 10 Convergence Criterion-指定限定收敛标准,系统默认值为0 。 11 Use running means 限定在每个观测量被分配到一类后即刻计算 新的类中心,不选此项表示只有当全部样本的类分配完后再计算类中 心,可以节省运算时间,所以一般情况下不选择此项。 本例中选择默认项。 图 8 Iterate对话框 3. 单出 Save按钮,打开 Save对话框见图 9. Cluster Member 在原数据文件中保存分类结果(本例选择)。 Distance from cluster center在原数据文件中保存各观测 量距所属类中心间的欧氏距离。 图 9 Save对话框 4. 单击 Options 按钮,打开 Options 对话框见图 10。 Statistics栏 Initial cluster centers 输出初始类中心。 ANOVA table 输出方差分析表 Cluster information for each case每个观测量的分类信息 ( 分类结果和 该观测量距所属类中心的距离等) 12 图 10 Options对话框 Missing Values

注意事项

本文(SPSS操作方法:聚类分析[整理])为本站会员(x****育)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.