数据库技术与应用 教学课件 ppt 作者 第13章 数据仓库与数据挖掘
23页1、第十三章 数据仓库与数据挖掘,本章学习目标,理解数据仓库的定义及OLAP应用。 理解数据挖掘的定义。 理解和掌握数据挖掘的应用。 理解数据挖掘与数据仓库的联系与区别。 理解数据挖掘常用的工具。,本章概述,随着信息技术的不断推广和应用,许多企业都已经在使用管理信息系统处理事务和日常业务。这些管理信息系统为企业积累了大量的信息。企业管理者开始考虑如何利用这些信息海洋,提取有用的信息对企业的管理决策提供支持。能否从纷繁复杂、大量沉淀的数据环境中取得有用的决策信息,已成为企业生存、发展、壮大的重要环节。因此,产生了与传统数据库有很大差异的数据环境的要求和从这些海洋数据中获取特殊知识的工具的需要。本章简要介绍数据仓库与数据挖掘的基本概念及应用。,主要内容,13.1 数据仓库概述,13.3 常用的数据挖掘工具优化,13.2 数据挖掘概述,主要内容,13.1 数据仓库概述,13.3 常用的数据挖掘工具优化,13.2 数据挖掘概述,13.1 数据仓库概述,13.1.1 数据仓库的定义,William H.Inmon定义了数据仓库是面向主题的、集成的、包含历史的、不可更新的、面向决策支持的、面向企业的、
2、最明细的数据存储、数据快照式的数据获取等。这些原则至今依然是指导数据仓库建设的最基本原则。 与传统数据库相比,数据仓库虽然是从数据库发展而来的,但是两者在许多方面都存在着很大的差异,如表13-1所示。 数据仓库的特性主要有面向主题性、数据集成性、数据的时变性、数据的非易失性、数据的集合性、支持决策等作用。 (1)面向主题性 数据仓库中的数据是面向主题的组织方式,这样可以在较高层次上对分析对象的数据给出完整的、一致的描述,排除对于决策无用的数据,提供特定主题的简明视图。 (2) 数据的集成性 构造数据仓库是将多个异种数据源集成在一起,确保命名约定,编码结构,属性度量等一致性。,13.1 数据仓库概述,(3) 数据的时变性 数据存储从历史的角度提供信息。在数据仓库,隐式或显式地包含时间元素。 (4)数据的非易失性 数据仓库总是物理地分离存放数据;由于这种分离,数据仓库不需要事务处理,恢复和并发控制。通常数据仓库只需要两种数据访问:数据的初始化装入和数据访问。 (5)数据的集合性 数据仓库以某种数据集合的形式存储。目前,数据仓库采用的集合方式有:多维数据库的多维模式、关系数据库的关系模式、多
3、维模式和关系模式相结合的混合模式。 (6) 支持决策的 数据仓库中的数据主要是提供决策进行查询,一般不一定都需要即时更新,可以定期刷新或按需刷新,13.1 数据仓库概述,13.1.2数据仓库的基本结构,数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。整个数据仓库系统是一个包含四个层次的体系结构。,13.1 数据仓库概述,13.1.2数据仓库的基本结构,数据源:是数据仓库系统的基础,是整个系统的数据源泉。通常包括内部数据和外部数据。内部数据包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部数据包括各类法律法规、市场信息和调查数据等。 数据存储与管理:是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。 联机分析处理 (OLAP:On-Line Analytical Processing)服务器:即从数据仓库中抽取详细数据的一个子集,并经过必要的聚集存储到OLAP服务器中供前端分析工具读取,对分析需要的数据进行有效集成,按多维模型予
4、以组织,以便进行多角度、多层次的分析,并发现趋势。 前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP服务器,报表工具、数据挖掘工具主要针对数据仓库。,13.1 数据仓库概述,13.1.2 数据仓库的主要应用,数据仓库主要应用在以下三个方面: (1) 信息处理 支持查询和基本的统计分析,并使用表或图进行报告。 (2) 分析处理 支持基本的OLAP操作,在汇总的和细节的历史数据上操作。 (3) 数据挖掘 支持知识发现,包括找出隐藏的模式和关联,构造分析模型,进行分类和预测,并用可视化工具提供挖掘结果。,13.1 数据仓库概述,13.1.2 数据仓库的主要应用,其中OLAP是数据仓库的一个主要应用,OLAP(联机分析处理)是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给用户。由于SQL对大型数据库进行的简单查询已不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需
《数据库技术与应用 教学课件 ppt 作者 第13章 数据仓库与数据挖掘》由会员E****分享,可在线阅读,更多相关《数据库技术与应用 教学课件 ppt 作者 第13章 数据仓库与数据挖掘》请在金锄头文库上搜索。
逍遥游复习 知识点整理
近现代法德关系史 高三展示课3稿
当代大学生人生信仰及追求的调查研究
长相思 纳兰性德-ppt课件
课件:危机意识 一
英语ppt演讲关于阿甘正传
发达国家基础教育改革的动向与趋势 修改版
中国民间美术 课件.ppt
生物质发电技术与系统 课程ppt 第1章 生物质发电技术现状及发展趋势 2学时 -----2016
现代信号处理思考题 含答案
执业药师继续教育 抑郁症的药物治疗 100分
小学生的成长档案模板不用修改 万能型
增订六版 现代汉语 上册 第二章文字 思考与练习答案
国家财政ppt课件
加拿大英语介绍
六年级统计图的选择课件
中学生成长档案ppt
中国现代文学史期末复习整理
lohi和hihilo训练对女子赛艇运动员运动能力影响的比较研究
风雨贾平凹阅读答案
2024-04-11 25页
2024-04-11 37页
2024-04-11 28页
2024-04-11 31页
2024-04-11 36页
2024-04-11 29页
2024-04-11 22页
2024-04-11 27页
2024-04-11 34页
2024-04-11 32页