电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据挖掘试验指导书

52页
  • 卖家[上传人]:206****923
  • 文档编号:91101764
  • 上传时间:2019-06-22
  • 文档格式:DOC
  • 文档大小:1.28MB
  • / 52 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、商务数据分析实验指导书(适用于国际经济与贸易专业)江西财经大学国际经贸学院编写人:戴爱明目 录前 言1实验一、SPSS Clementine 软件功能演练5实验二、SPSS Clementine 数据可视化9实验三、决策树C5.0 建模17实验四、关联规则挖掘30实验五、聚类分析(异常值检测)38前 言一、课程简介商务数据分析充分利用数据挖掘技术从大量商务数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。数据挖掘的广义观点:数据挖掘就是从存放在数据库,数据仓库或其他信息库中的大量的数据中“挖掘”有趣知识的过程。数据挖掘,又称为数据库中知识发现(Knowledge Discovery in Database, KDD),因此,数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。数据挖掘有机结合了来自多学科技术,其中包括:数据库、数理统计、机器学习、高性能计算、模式识别、神经网络、数据可视化、信息检索、图像

      2、与信号处理、空间数据分析等,这里我们强调商务数据分析所处理的是大规模数据,且其算法应是高效的和可扩展的。通过数据分析,可从数据库中挖掘出有意义的知识、规律,或更高层次的信息,并可以从多个角度对其进行浏览察看。所挖掘出的知识可以帮助进行商务决策支持。当前商务数据分析应用主要集中在电信、零售、农业、网络日志、银行等方面。二、课程的任务和实验的教学目标课程编号:课程属性:专业任选课实验学时:8 适用专业:国际经济与贸易先修课程:数据库技术、概率论与数理统计、统计学商务数据分析是一门理论和实践相结合的课程,其上机实验的目的主要是实现数据挖掘的主要算法,训练学生实际动手进行数据挖掘设计和软件应用的能力,加深对数据挖掘相关概念和算法的理解。本课程具有技术性和实践性较强的特点,因此,配合基本原理的讲授,应当安排相应的实习操作。通过实验和操作,使学生巩固和加深数据仓库与数据挖掘理论知识,进一步加强学生独立分析问题和解决问题的能力、综合设计及创新能力的培养,为今后工作打下良好的基础。经过多层次、多方式的全面训练后,学生应达到下列要求:1进一步巩固和加深数据挖掘基本知识的理解,提高综合运用所学知识,建立、

      3、管理和分析商务数据的能力。2能根据需要选学参考书,查阅相关的工具,通过独立思考,深入钻研有关问题,学会自己独立分析问题、解决问题,具有一定的创新能力。3能正确处理大规模数据,选择数据挖掘工具的开发平台和相关的软件解决实践问题。4能独立撰写实验报告,准确分析实验结果,总结有关的问题,提出相关的建议。三、实验教材及参考书理论课教材及参考书:F 数据仓库与数据挖掘教程(丛书名: 高等院校信息管理与信息系统专业系列教材)作者: 陈文伟 编著,清华大学出版社,2006.8F 数据仓库和数据挖掘,苏新宁 等编著,清华大学出版社,2006.4F 数据仓库与数据挖掘技术(第2版),陈京民 编著,电子工业出版社,2007.11F Jiawei Han, Micheline Kamber. Data Mining: Concepts and Techniques.高等教育出版社(影印版),2001.5.F Ian H. Witten, Eibe Frank. Data Mining: Practical Machine Learning Tools and Techniques (第二版). 机械工业出版

      4、社(影印版),2005.F Richard J. Roiger, Michael W. Geatz. Data Mining: A Tutorial-Based Primer.清华大学出版社,2003.实验教材:F 数据挖掘Clementine应用实务,谢邦昌 主编,机械工业出版社,2008.4F 数据挖掘原理与SPSS Clementine应用宝典,元昌安 主编,电子工业出版社,2009.8四、实验基本内容及学时分配按照商务数据分析实验教学大纲的要求,共设立实验4个,总计20学时。试验基本内容与学时分配如下表:序号实验名称实验学时每组人数实验属性实验者类别开出要求1SPSS Clementine 软件功能演练11演练本科必开2实验二、SPSS Clementine 数据可视化11演练本科必开3分类发现21验证综合本科必开4关联规则21验证综合本科必开5聚类分析(异常检测)21验证综合本科必开五、实验方式与基本要求1、本课程的实验为非单独设课,因此,应该课程的内容安排和进度,配合技术原理的讲授,进行相应的操作和实验。 2、该课以综合性实验为主,教师给出实验题目,实验前学生必须进行预习,

      5、 3、在规定的时间内,由学生独立完成,出现问题,教师要引导学生独立分析、解决,不得包办代替。4、实验中按要求做好学生实验情况及结果记录,实验后认真填写实验记录。5、 实验指导书仅作为上机时的参考步骤,不能作为唯一的依据,以教材和课堂讲授为准。实验一、SPSS Clementine 软件功能演练【实验目的】1、熟悉SPSS Clementine 软件功能和操作特点。2、了解SPSS Clementine 软件的各选项面板和操作方法。3、熟练掌握SPSS Clementine 工作流程。【实验内容】1、打开SPSS Clementine 软件,逐一操作各选项,熟悉软件功能。2、打开一有数据库、或新建数据文件,读入SPSS Clementine,并使用各种输出节点,熟悉数据输入输出。(要求:至少做access数据库文件、excel文件、txt文件、可变文件的导入、导出)【实验步骤】1、启动 Clementine:请从 Windows 的“开始”菜单中选择: 所有程序SPSS Clementine 11.1SPSS Clementine client 11.12、Clementine窗口当第一

      6、次启动 Clementine 时,工作区将以默认视图打开。中间的区域称作流工作区。在 Clementine 中,这将是用来工作的主要区域。Clementine 中绝大部分的数据和建模工具都在选项板中,该区域位于流工作区的下方。每个选项卡都包含一组以图形表示数据挖掘任务的节点,例如访问和过滤数据,创建图形和构建模型。要将节点添加到工组区,可在节点选项板中双击图标或将其拖拽至工作区后释放。随后可将各个图标连接以创建一个表示数据流动的流。窗口的右上方是输出和对象管理器。这些选项卡用于查看和管理各种 Clementine 对象。“流”选项卡包含了当前会话中打开的所有流。可以将这些流保存并关闭,也可将其添加到工程中。“输出”选项卡包含了由 Clementine 中的流操作产生的各类文件。可以显示、重命名和关闭此处所列的表格、图形和报告。“模型”选项卡是一个功能强大的工具,包含了在一次会话中产生的所有模型(即,已在 Clementine 中构建完毕的模型)。通过它,可以对模型作更深入的查看、将其添加至流中、导出或为其加注解。窗口右侧底部的部分是工程工具,它用来创建和管理数据挖掘工程。查看在 Cle

      7、mentine 中创建的工程有两种方式 - 类视图或 CRISP-DM 视图。 “CRISP-DM”选项卡提供了一种组织工程的方式。“类”选项卡提供了一种在 Clementine 中按类别(即,按照所创建对象的类别)组织工作的方式。当要获取数据、流、模型等对象的详尽目录时,这种视图十分有用。 实验二、SPSS Clementine 数据可视化【实验目的】1、熟悉SPSS Clementine 绘图。2、了解SPSS Clementine 图形选项面板各节点的使用方法。3、熟练掌握SPSS Clementine 数据可视化流程。【实验内容】1、打开SPSS Clementine 软件,逐一操作各图形选项面板,熟悉软件功能。2、打开一有数据库、或新建数据文件,读入SPSS Clementine,并使用各种输出节点,熟悉数据输入输出。(要求:至少做分布图、直方图、收集图、多重散点图、时间散点图)【实验步骤】1、启动 Clementine:请从 Windows 的“开始”菜单中选择: 所有程序PSS Clementine 11.1SPSS Clementine client 11.12、建立一

      8、个流、导入相关数据,打开图形选项面板3、绘制以下各类图形(1)以颜色为层次的图(2)以大小为层次的图(3)以颜色、大小、形状和透明度为层次的图(4)以面板图为层次的图(5)三维收集图(6)动画散点图(7)分布图(8)直方图(9)收集图(10)多重散点图未标准化时的多重散点图标准化后的多重散点图(11)网络图实验三、决策树C5.0 建模【实验目的】1、熟悉SPSS Clementine建模方法。2、掌握SPSS Clementine分布图、散点图、网络图的创建方法。3、掌握决策树C5.0决策方法。【实验内容】1、创建散点图。2、创建分布图。3、创建网络图。【实验步骤】假设你是一位正在汇总研究数据的医学研究员。已收集了一组患有同一疾病的患者的数据。在治疗过程中,每位患者均对五种药物中的一种有明显反应。的任务就是通过数据挖掘找出适合治疗此疾病的药物。此示例使用名为 druglearn.str 的流,此流引用名为 DRUG1n 的数据文件。可以从任何 Clementine Client 安装软件的 Demos 目录下找到这些文件,也可以通过从 Windows 的“开始”菜单选择 Start All Programs SPSS Clementine 11.1 Demos访问这些文件。文件 druglearn.str 位于 Classification_Module 目录中。此 demo 中使用的数据字段包括: 年龄(数值)性别M 或 FBP血压:高、正常或低胆固醇血液中的胆固醇含量:正常或高Na血液中钠的浓度K血液中钾的浓度药品对患者有效的处方药1、读取文本数据使用变量文件节点读取定界文本数据。可以从选项板中添加变量文件节点,方法是单击源选项卡找到此节点,或者使用收藏夹选项卡(默认情况下,其中包含此节点)。然后,双击新添加的节点以打开相应的对话框。单击紧挨“文件”框右边以省略号“.”标记的按钮,浏览到系统中的 Clementine 安装目录。打开 demos 目录,然后选择名为 DRUG1n 的文件。选择从文件读取字段名,并注意已载入此对话框中的字段和值。单击

      《数据挖掘试验指导书》由会员206****923分享,可在线阅读,更多相关《数据挖掘试验指导书》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.