电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第4章

97页
  • 卖家[上传人]:E****
  • 文档编号:89184288
  • 上传时间:2019-05-20
  • 文档格式:PPT
  • 文档大小:2.05MB
  • / 97 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、第四章 联机分析处理(OLAP),2,第四章 目录,4.1 OLAP概念 4.2 OLAP的基本操作 4.3 OLAP的数据模型 4.4 OLAP分类和服务器类型 4.5 基于多维数据库的OLAP(MOLAP) 4.6 基于关系数据库的OLAP(ROLAP) 4.7 OLAP实现 4.8 OLAP的衡量和特性 4.9 本章小结,3,数据仓库是管理决策分析的基础,要有效地利用数据仓库的信息资源,必须要有强大的工具对数据仓库的信息进行决策分析。On-line Analytical Processing(在线分析处理或联机分析处理)就是一个应用广泛的数据仓库使用技术。它可以根据分析人员的要求,迅速灵活地对大量的数据进行复杂的查询处理,并以直观的容易理解的形式将查询结果提供给各种决策人员,使他们能够迅速准确地掌握企业的运营情况,了解市场的需求。,4,第四章 联机分析处理(OLAP),4.1 OLAP概念 4.1.1 什么是OLAP 4.1.2 OLAP的相关基本概念 4.1.3 OLAP和OLTP的区别 4.1.4 OLAP和数据仓库的区别 4.2 OLAP的基本操作 4.3 OLAP的数据模

      2、型 4.4 OLAP分类和服务器类型 4.5 基于多维数据库的OLAP(MOLAP) 4.6 基于关系数据库的OLAP(ROLAP) 4.7 OLAP实现 4.8 OLAP的衡量和特性 4.9 本章小结,5,4.1 OLAP概念,OLAP发展背景:60年代,关系数据库之父E.F.Codd提出了关系模型,促进了联机事务处理(OLTP)的发展(数据以表格的形式而非文件方式存储)。1993年,E.F.Codd提出了OLAP概念,认为OLTP已不能满足终端用户对数据库查询分析的需要,SQL对大型数据库进行的简单查询也不能满足终端用户分析的要求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此,E.F.Codd提出了多维数据库和多维分析的概念,即OLAP。,6,4.1.1 什么是OLAP,定义4.1 OLAP(联机分析处理)是针对某个特定的主题进行联机数据访问、处理和分析,通过直观的方式从多个维度、多种数据综合程度将系统的运营情况展现给使用者。 定义4.2 OLAP(联机分析处理)是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致

      3、、交互地存取,从而获得对数据的更深入了解的一类软件技术。(OLAP委员会的定义) OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是“维”这个概念,因此OLAP也可以说是多维数据分析工具的集合。,7,OLAP 的特点: 多维性 OLAP服务通过支持多维聚合路径(dimensional aggregation path)或层次结构和/或多重层次结构,提供了大量数据视图或多维的概念性视图。 容易理解 为OLAP 分析设计的数据仓库或数据集市可以处理与应用程序和开发人员相关的任何业务逻辑和统计分析,同时使它对于目标用户而言足够简单。 交互性 OLAP帮助用户通过对比性的个性化查看方式,以及对各种 “what-if”数据模型场景中的历史数据和预计算数据进行分析,将业务信息综合起来。用户可以在分析中定义新的专用 计算,并可以以任何希望的方式报告数据。 快速 OLAP服务常常以多用户的客户机/服务器模式实现,而且无论数据库的规模和复杂性有多大,都能够对查询提供一致的快速响应。合并的业务数据可以沿着所有维度中的层次结构预先进行聚合,从而减少构建OLAP报告所需的运行

      4、时间。,4.1.1 什么是OLAP,8,4.1.2 OLAP的相关基本概念,1. 变量 变量是从现实系统中抽象出来的,用于描述数据的实际意义,即描述数据“是什么”(人数、单价、销售额等)。变量都有一定的取值范围,比如“人数”的取值范围是“大于等于零的整数”。取值范围实际上是具体问题对变量的约束。 2. 维 维是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。 3. 维的层次(levels) 人们观察数据的某个特定角度(即某个维)还可以存在细致程度不同的各个描述方面(时间维:日期、月份、季度、年)。 维度的层次性是人们观察数据细致程度不同造成的,维度层次的确定需要具体问题具体分析,不同分析应用对数据组织的详略程度不同,将使同一维度上的层次繁简不同。 4. 维的成员 维成员也称维的取值。如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成,如“2004年6月30日”是在具有3个层次的时间维上的一个取值。 5. 多维数据集 多维数据集是决策分析的支柱,OLAP的核心,有时也称立方体或者超立方。OLAP展现在用户面前的是一幅幅多维视图。

      5、多维数据集可以用一个多维数组来表示。,9,6. 多维数组 图4.1 按多维数组组织起来的三维立方体(multicube) 多维数组是维和变量的组合表示。一个多维数组可以表示为:维1,维2,维n,变量,比如:图4.1所示的商品销售数据是按时间、地区和产品组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(时间,地区,产品,销售额)。如果在图4.1的基础上扩展一个维“销售渠道”,就得到一个四维的结构。 7. 数据单元(单元格) 数据单元(单元格)是多维数组的取值。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值,比如:2004年3月,昆明,笔记本电脑,$80000。,4.1.2 OLAP的相关基本概念,10,4.1.3 OLAP和OLTP的区别,OLAP和OLTP的区别: OLAP面向的是市场,主要供企业的决策人员和中高层管理人员使用,用于数据分析。而OLTP是面向顾客的,主要供操作人员和低层管理人员使用,用于事务和查询处理。 OLAP系统管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息。这些特点使得数据更容易用于决策分析。O

      6、LTP系统则仅管理当前数据,通常,这种数据太琐碎,难以用于决策。 OLAP系统处理的是来自不同组织的信息,由多个数据存储集成的信息。由于数据量巨大,OLAP数据存放在多个存储介质上,不过,对OLAP系统的访问大部分是只读操作,尽管许多可能是复杂的查询。相比之下,OLTP系统则主要关注企业或部门内部的当前数据,而不涉及历史数据或不同组织的数据。它们的区别概括于表4.1中。,11,4.1.3 OLAP和OLTP的区别,表4.1 OLAP和OLTP的区别,12,4.1.4 OLAP和数据仓库的区别,OLAP 是大多数数据仓库解决方案中使用的报告实现之一。OLAP 解决方案有时候被错误地称为数据仓库解决方案。在为某个部门或有限的用户群开发 OLAP 解决方案时,这种说法尤其容易引起误解。 数据仓库最重要的特性是数据集成,而数据仓库最重要的用途是信息数据呈现。OLAP 服务并不是主要针对数据集成而设计的;但是,它是一种强大的数据呈现方法,在大多数数据仓库解决方案中都使用 OLAP。,13,4.1.4 OLAP和数据仓库的区别,典型的 OLAP 服务常常源自一个或多个专门设计的数据集市。OLAP

      7、服务应该被看作数据仓库解决方案的一部分,参见图 4.2。 图4.2 数据仓库中的OLAP报告,14,第四章 联机分析处理(OLAP),4.1 OLAP概念 4.2 OLAP的基本操作 4.2.1 数据切片(SLICE) 4.2.2 数据切块(DICE) 4.2.3 数据上探/下钻(DRILL-UP/DRILL-DOWN) 4.2.4 数据旋转(PIVOT) 4.2.5 其它OLAP操作 4.3 OLAP的数据模型 4.4 OLAP分类和服务器类型 4.5 基于多维数据库的OLAP(MOLAP) 4.6 基于关系数据库的OLAP(ROLAP) 4.7 OLAP实现 4.8 OLAP的衡量和特性 4.9 本章小结,15,4.2 OLAP的基本操作,OLAP的基本操作是指通过对多维形式组织起来的数据进行切片、切块、聚合、钻取、旋转等分析动作,以求剖析数据使用户能够从多种维度、多个侧面、多种数据综合度查看数据,从而深入地了解包含在数据中的信息、内涵。OLAP的操作方式迎合了人的思维模式,因此减少了混淆,降低了出现错误解释的可能性。下面我们逐一介绍OLAP的基本操作内容。,16,4.2.1 数据

      8、切片(SLICE),定义4.3 在多维数组的某一维上选定一个取值,则多维数组就从n维降成了n1维,我们称多维数组的子集(维度1,维度2,维成员Vi,维度n,变量)(设维度i的维成员取Vi)为多维数组在维度i上的切片。 例4.1 图4.3所示是一个按产品维、城市维和时间维(年)组织起来的产品销售数据,用多维数组表示为(时间,城市,产品,销售额)。如果在城市维上选定一个维成员(设为“上海”或“广州”),就得到了在城市维上的一个切片;如果在产品维上选定一个维成员(设为“电视机”或“电冰箱”),就得到了在产品维上的一个切片。显然,这些切片的数目取决于每个维成员的个数。 图4.3 数据切片示意图,17,按照定义4.3,一次切片一定使原来维数减1,因此所得的切片结果并不一定是二维的“平面”,其切片结果的维数取决于原来的多维数组的维数。这样的切片定义不够通俗易懂,所以我们给出了切片的另一个定义(这两个定义是不等价的)。 定义4.4 选定多维数组中两个维:维i和维j,在这两个维上取某一区间或任意的维成员,而将其余的维都分别取定一个维成员的动作称为多维数组在维i和维j上的一个切片,表示为:(维i,维j,

      9、变量)。,4.2.1 数据切片(SLICE),18,例4.2 对于例4.1,选定多维数组(时间,城市,产品,销售额)中的时间维度与产品维度,而在城市维上取定一个维成员(设为“上海”或“广州”),就得到了多维数组(时间,城市,产品,销售额)在时间和产品两维上的一个切片(时间,产品,销售额)。它表示“上海”或“广州”地区各产品、每年的销售情况。相应地,选定时间维度与城市维度,而在产品维上取定一个维成员(设为“电视机”或“电冰箱”),就得到了多维数组(时间,城市,产品,销售额)在时间和城市两维上的一个切片(时间,城市,销售额)。 从定义4.4可以得出两点: 1)一个多维数组的切片最终是由该数组中除切片所在平面的二个维之外的其他维的成员值确定的。 2)维是观察数据的角度,那么切片的作用或结果就是舍弃一些观察角度,使人们能在两个维上集中观察数据。因为人的空间想象能力毕竟有限,一般很难想象四维以上的空间结构。所以对于维数较多的多维数据空间,数据切片是很有意义的。 定义4.4可以看成是定义4.3的一个特例。对于一个n维数组,按定义4.3进行的n-2次切片的结果,就必定是对应于按定义4.4进行的某一次切片的结果。,4.2.1 数据切片(SLICE),19,4.2.2 数据切块(DICE),和切片相对应,我们对切块也下两个定义: 定义4.5 将多维数组某一维上的取值设定为一个区间(例如取“1999至2004年”)的维成员的动作称为切块。显然,当这一区间只取一维成员时,即得到一个切片(见定义4.3)。 定义4.6 选定多维数组中三个维:维i、维j和维k,在这三个维上取某一区间或任意的维成员,而将其余的维都分别取定一个维成员的动作称为多维数组在维i、维j和维k上的一个切块,表示为:(维i,维j,维k,变量)。 从另一个角度来讲,切块可以看成是由多个切片叠合而成。 例4.3 在图4.3中,如果将城市维上的取值设定为一个区间(例如取上海、北京、广州),而非单一的维成员时,就得到一个数据切块,它可以看成是上海、北京和广州三个切片叠合而成。,20,4.2.3 数据上探/下钻(DRILL-UP/DRILL-DOWN),维度是有层次性的,如时间维可能由年、季、月、日构成,维度的层次实际上反映了数据的综合程度。维度层次越高,代表的数据综合度越高,细节越少,

      《数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第4章》由会员E****分享,可在线阅读,更多相关《数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第4章》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.