好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

有关数据挖掘结果的整体输出.ppt

56页
  • 卖家[上传人]:ap****ve
  • 文档编号:118736413
  • 上传时间:2019-12-24
  • 文档格式:PPT
  • 文档大小:1,009.50KB
  • / 56 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社 2 2 第22章 数据挖掘结果的输出 本章包括 结果输出的概述 表节点的输出 通过矩阵方式建立关系表 评估预测值的输出 数据审核报告 统计量输出 均值的输出 数据的质量报告 格式化的报告输出 全局量的输出 SPSS导出结果 22.1 结果输出的概述 图22-1输出节点选项板 输出节点选项板包含16种输出节点:表格、矩阵、分 析、数据审核、统计量、均值、质量、报告、设置全 局量、Publisher 、数据库、平面文件、SPSS导出、 SAS导出、Excel、SPSS程序 Clementine 系统窗口的右边包含着管理工具,它可以 帮助用户浏览目前的输出对象,如图22-2所示 图22-2 管理工具的输出 从图22-2可以看出,用户可以: 打开目前的输出对象,如直方图、评估图和表 保存输出对象 添加输出文件到目前的项目中 从目前的会话中删除未保存的输出对象 为输出对象更改名称 22.2 表节点的输出 图22-3 表节点的设置 22.2.1 表节点格式设置 图22-4 表格节点对话框格式页签 参数说明: 字段:显示了被选字段的名称。

      格式:设置字段格式 调整:指定怎样在表格列中调整字段值默认设置是“自动”,符号型值左对 齐,数值型右对齐用户可以不考虑默认设置通过选择左、右或中间对齐 宽度:默认列的宽度是根据字段的值被自动计算出来不考虑“自动”宽度计 算,则取消“自动”宽度,并且在下一个列中输入“手控”的宽度 查看当前字段:默认对话框将显示一系列目前使用的字段为了显示一系 列没被使用的字段,则选择“查看未使用的字段设置”单选按钮 内容菜单:这个页签的内容菜单提供了各种各样的选项和更新选项设置, 且还有下一级子菜单 22.2.2 通过表浏览器来操作 图22-5 表浏览器窗口 相关参数设置如下: 选择单元格:选择单个的单元格只需点击那个单元格为了选 择一个矩形范围的单元格点击所要范围的一个角,拖拉鼠标到 另一个角,然后松开鼠标按钮为了选择一个完整的列,点击 那一列的标题在列的标题上按住shift+Click或按住Ctrl+Click 选择多个列 重排列:用户可以移动表中的列,通过点击用户想要移动的列 的标题,拖拉它到目的位置当用户拖拉这一列时,表更新显 示新列的次序 搜索表格:在主工具栏搜索按钮激活搜索工具栏,允许用户搜 索指定值。

      用户可以在表中向前或向后搜索, 用户可以指定一 个区分大小写搜索( Aa按钮), 并且用户可以通过使用中断搜索 按钮中断一个搜索过程如图22-6所示 图22-6 搜索控制被启动的表 生成:这个生成菜单包含节点生成操作如图22-5所示 (1)选择节点(“记录”):生成一个选择节点,它选择表中被选择的单元格 的记录 (2)选择节点(“与”):生成一个选择节点,它选择包含表中被选择的所有 值的记录 (3)选择节点(“或”):生成一个选择节点,它选择包含表中被选择的任一 值的记录 (4)导出节点(“记录”):生成一个导出节点来建立一个新的标记字段 (5)导出节点(“与”):生成一个导出节点来建立一个新的标记字段 (6)导出节点(“或”):生成一个来源节点来建立一个新的标记字段 22.3 通过矩阵方式建立关系表 图22-7 矩阵输出的设置 相关参数的设置如下: 使用:使用的字段,从下列选项中选择一个字段的选择类型: (1)选择:这个选项允许用户为矩阵的行和列选择一个符号型字段矩阵的 行和列通过一系列被选择的符号型字段的值来定义。

      这个矩阵的单元格包 含了下面被选择的汇总统计量 (2)所有标志字段(真值):这个选项要求对数据中每个标志字段生成一个 仅有一行和一列的一个矩阵矩阵中的单元格对于每个标志生成变量组合 都为真的计数 (3)所有数值字段:这个选项要求这样的一个矩阵,这个矩阵对于每个数值 型字段都是只有一行一列的这个矩阵中的单元格代表了对于相应的一对 字段的交叉积的总和 单元格内容:如果用户已经选择了“选择”字段,用户 可以指定被用在矩阵单元格的统计量,选择一个基于 计数的统计量,或者选择一个负载字段来概括一个数 值型字段,这个概括是基于行和列字段的值的 (1)交叉列表:单元格的值是计数和/或百分数,这个 百分数是代表有多少记录是有相应结合的值的 (2)函数:如果用户选择了一个汇总函数,单元值是 一个被选择的负载字段值的函数,这个负载字段值是 对于有适当的行和列的值的个案的 22.4 评估预测值的输出 图22-8 分析节点的分析设置 相关的参数说明: 一致性矩阵(用于字符型目标字段):显示对于符号型目标变 量的每个被生成的(被预测的)字段和它的目标字段之间匹配 的模式用一个表格来显示,它的行被定义为实际值,列被定 义为预测值,每一个单元格里是模式的记录数。

      绩效评价:对符号型输出的模型显示表现评估统计量这些统 计量报告输出字段的每一类别,是一种平均信息量的度量,这 些平均信息量是对于属于那种类别的预测记录的模型中的 置信度图表(如果可用):对于生成一个置信度字段的模型,这个选项报 告在置信值上的统计量和它们的关系来预测 对于这个选项有两个设置: (1)阈值用于:报告在指定为百分数的精确度以上的置信度水准 (2)改善精确性:报告这样的置信度水准,在此水准之上的精度是由指定的 因子提高的 按分区分割:如果定义了分割数据集,则分别显示各个数据集的分析结果 按用户定义的分析:用户可以指定自己的分析计算用来评估模型使用 CLEM表达式来指定对每个记录应该计算什么和怎样把记录水平得分合并 到一个全面的得分使用函数@TARGET和@PREDICTED 分别表示目标 值(实际输出)和预测值如图22-9所示为定义用于分析的用户测量标准 对话框 参数说明: (1)If:如果用户需要使用依据某些条件而得到不同的计算结果,指定一个条件表达语句 (2)Then:如果If条件是真,指定一个计算 (3)Else:如果If条件是假,指定一个结果。

      (4)计算得分为:选择一个统计量从个别的得分中计算出一个全面的得分 ●按字段分解分析:显示可用于中止分析的符号型字段除了全面分析之外,对每个分解字段的 每个类别的一个单独的分析将被报告 图22-9定义用于分析的用户测量标准对话框 图22-10分析输出浏览器 相关的参数说明: 输出字段结果:这个分析输出对每个输出字段而言包含一个项 ,这个输出字段相应于由一生成模型建立的预测字段 比较:在输出字段里,对于每个和那个输出字段有关联的预测 字段来说,“项”是一个子部分对于符号型输出字段,这个“项 ”的最高层包含一个表,这个表显示了正确和不正确的数目和 百分数以及在流中记录的总数对于符号型输出字段,这个“ 项”显示了下列信息,如表22-1所示 一致性矩阵:对于符号型输出字段,如果用户需要在分析选项 中的一个一致性矩阵,则一个包含此矩阵的子部分就会出现在 这里它的行代表了实际观察值,而列代表了预测值在表中 的单元格则代表了每一个结合了预测值和实际值的记录的数 表现评估:对于符号型输出字段,如果用户要求在分析选项中 的表现评估的统计量,则这个表现评估的结果将显示在这里 每一个输出类别及它的表现评估统计量都被列在这里。

      置信度报告:对于符号型输出字段,如果用户要求在分析选项 中的置信度,则即为此值以下的统计量是为模型的置信度而 报告的信息,如表22-2所示 两者协议: 如果两个或者更多的预测相同输出字段的生成模型 被包括在一个流中,用户会看到由模型生成的预测值之间的一 致性统计量 这里包括对于预测值一致 (对于符号型输出字 段) 或者错误的汇总统计量 (对于数值型输出字段)的记录 的数目和百分数对于符号型的字段,它包括一个将预测值同 实际值对比的分析,是对模型一致(生成相同预测值)的记录 的子集的分析 22.5 数据审核报告 图22-11 数据审核节点对话框设置 相关参数的设置如下: 默认:使用系统默认的字段 使用定制字段:为了能初步认识数据,用户可根据自己感兴趣 的数据进行分析,点击“字段选取器”图标按钮选择需要的字段 字段:要进行数据审核的字段列表 交叠:此选项在审核报告中经常用于极小图像之中,在数值型 数据中,方差和协方差可以算出 显示:数据审核提供了3显示方式:图形、基本统计量、中位 数和众数 图22-12 数据审核输出浏览器 相关参数说明如下: 审查结果:审查报告列出了所有的字段,并以图像、统计量等形式展现出 来,使用户对数据有一个大概的了解。

      选择单元格:选择单个的单元格只需点击那个单元格为了选择一个矩形 范围的单元格点击所要范围的一个角,拖拉鼠标到另一个角,然后松开鼠 标按钮 排序:用户可以直接通过点击列表中的列标题对列表排序,有三种排序方 式:自动、升序、降序 生成菜单:生成菜单包含生成节点的操作: (1)过滤节点 (2)重新分类阶段 (3)分级节点 (4)导出节点 (5)图形输出 (6)图形节点 输出浏览器显示数据分析的结果和允许用户进行操作,包括悬着字段、基于 选择、生成新的节点、存储和打印结果等保存、输出和打印的选项都可 以从“文件”菜单中获得,并且通常的编辑选项也可从“编辑”菜单中获得 ●审查结果:审查报告列出了所有的字段,并以图像、统计量等形式展现出来 ,使用户对数据有一个大概的了解 ●选择单元格:选择单个的单元格只需点击那个单元格为了选择一个矩形范 围的单元格点击所要范围的一个角,拖拉鼠标到另一个角,然后松开鼠标 按钮 当用户想要一个新的选择,则旧的选择被取消在选择时,按住Ctrl键, 用户可以增添新的选择到任何目前存在的选择上,而不用取消旧的选择 用户可以使用这个方法来选择多个,不邻近的表中区域。

      这些选择选项也 可在编辑菜单中获得 ●排序:用户可以直接通过点击列表中的列标题对列表排序,有三种排序方式 :自动、升序、降序列表排序随着点击列标题而变化 ●生成菜单:生成菜单包含生成节点的操作: (1)过滤节点:生成一个过滤节点,它是基于审核分析的结果来过滤字段的 (2)重新分类阶段:生成一个分类节点,它是基于审核分析的结果来分类的 (3)分级节点:生成一个分级节点,它是基于审核分析的结果来生成的 (4)导出节点:导出一个节点 (5)图形输出:输出相应的图形 (6)图形节点:生成一个图形节点,它是基于审核分析的结果来生成的 22.6 统计量输出 图22-13 统计量输出的设置参数 相关参数的设置如下: 检查:选择字段或者选择用户想要个别汇总统计的字段用户可以选择多 个字段 统计量:选择统计量来报告可获得的选项包括“计数”、“平均值”、“合计” 、“最小值”、“最大值”、“全距”、“方差”、“标准差”、“均值标准误差”、“中位 数”等 相关:选择字段或者用户想要关联的字段用户可以选择多个字段当相 关的字段被选择时每个检查字段和相关字段的相关性将被列在输出中 相关设置:用户可以定制描述性的设置附在输出中的相关值上。

      图22-14 统计量节点相关设置参数 22.6.1 统计量输出浏览器 图22-15统计量输出浏览器窗口 每个被检查字段输出包含一个部分,此部分包含一张所 要求的统计量的表 计数:字段的有效记录数 平均值:所有记录的字段。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.