数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第3章
70页1、1,第三章 数据仓库模型设计及数据仓库建立,2,第三章 目录,3.0 相关概念 3.1 数据仓库的概念模型设计 3.2 数据仓库的逻辑模型设计 3.3 数据仓库的物理模型设计 3.4 数据仓库的建立过程 3.5 提高数据仓库性能 3.6 本章小结,3,3.0 相关概念,数据模型是对现实世界的反映和抽象,它可以充分体现用户的业务需求,清楚地表达各个部门之间的相关性,有效地消除冗余数据。 数据仓库模型包括概念模型、逻辑模型和物理模型。 概念模型描述的是客观世界到主观世界的映射。 逻辑模型描述的是主观世界到关系模型的映射。 物理模型描述的是关系模型到物理实现的映射。,4,3.1 数据仓库的概念模型设计,3.1.1 E-R模型 3.1.2 面向对象的分析方法,5,3.1.1 E-R模型(1),在概念模型中,最常用的表示方法是E-R法(实体-联系法),这种方法用E-R图作为它的描述工具。 E-R图描述的是主题以及主题之间的联系。如图3.1所示。,图3.1 E-R模型的概念模型设计过程,6,任务和环境的评估 结合用户的现状来明确数据仓库的目标任务,看在原有的数据库系统中“有什么”、“怎样组织的”和
2、“如何分布的”。 需求的收集和分析 考虑决策者的决策类型、决策者感兴趣的问题、解决这些问题所需要的信息、这些信息的来源。 主题选取,确定主题间关系 主题选择的原则包括: 优先实施管理者目前最迫切需求、最关心的主题。 优先选择能够在较短时间内发生效益的决策主题。 推后实施业务逻辑准备不充分的主题。 推后考虑实现技术难度大、可实现性较低、投资风险大的主题。,3.1.1 E-R模型(2),7,主题内容描述 主题的公共码键。 主题之间的联系。 主题的属性。 E-R图 长方形表示主题,在框内写上主题名; 椭圆形表示主题的属性; 用无向边把主题与其属性连接起来; 用有向边表示主题之间的联系:单向边表示一对多的关系,双向边表示多对多的关系,无向边表示一对一的关系。举例如下:,3.1.1 E-R模型(3),8,例: 建立中医方剂数据仓库。 方剂中的信息可以分为两部分:一部分是药物的配比,即需要哪几味中药,每种药材各需要多少;另一部分则是其主治的病症,这两部分信息被方剂有机地联系在一起。药物的配比是由药理决定的,而病症的规则又是与病因和发病的机理密切联系,要分析方剂,就不可能不研究这两方面的信息。因此可
3、以确定主要的主题为方剂主题用于分析药物间的配伍规律;药物主题用于分析药理;病症主题用于分析各种临床表现间的关联关系及症型识别,所需的数据为方剂数据、药物数据、病症数据。,3.1.1 E-R模型(4),9,一种药物可以在多首处方上出现,一首处方可以包含多种药物,因此“处方”主题与“药物”主题之间是多对多的方药关系;一首处方可以治疗多种病症,一种病症可以使用多首处方来治疗,因此“处方”主题与“病症”主题之间也是多对多的方症关系。对各主题的属性信息的描述如表3.1所示。,3.1.1 E-R模型(5),10,中医方剂数据仓库的E-R概念模型见图3.2。,图3.2 中医方剂数据仓库的概念模型,3.1.1 E-R模型(6),11,E-R图的优点: 对客观世界的描述能力较强,具有良好的可操 性,形式简单直观,易于理解,便于与用户交流。 E-R图的缺点: 主题之间的关系只包括一对多和多对多,这在某些错综复杂的关系面前就显得表达能力有限 ,且对企业模型进行静态的描述,对于企业动态运作处理的描述无能为力。,3.1.1 E-R模型(7),12,3.1.2 面向对象的分析方法(1),采用面向对象方法进行概念模
4、型设计时,E-R模型中的实体、实体的属性、实体间的关系分别转化为面向对象系统中的类、类的属性、类间的关系。面向对象方法的概念模型设计过程如图3.3所示。,图3.3 面向对象方法的概念模型设计过程,13,类是对某种类型事物的抽象,它将这类事物所具有的共同特征(包括操作特征和存储特征)集中起来,以说明这类事物的能力和性质。 类常用的图形表示方法是类表。类表由名称、属性集合、动作集合三部分组成,如图3.4所示。,图3.4 类表,3.1.2 面向对象的分析方法(2),14,类之间存在的三种关系: 继承。继承是指从某个类中派生出具有诸多相同属性的子类,被派生的类称为基类。子类具备基类的一切属性,同时又具备了与其他子类不同的特征属性。 包容。包容是某个类包含了其他的类。 关联。除了包容和继承关系之外,类之间的其他关系都归入关联关系。关联关系可以通过类的动作来体现,如图3.5所示。,图3.5 关联关系,3.1.2 面向对象的分析方法(3),15,包容和继承的区别: 包容和继承最大的区别在于被包容的类不从包容类中继承属性和动作,相反,包容类的动作是被包容类作为整体而产生的新动作。 两者的区别方法: 将
《数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第3章》由会员E****分享,可在线阅读,更多相关《数据仓库与数据挖掘原理及应用(第二版) 教学课件 ppt 作者 王丽珍 周丽华 陈红梅 第3章》请在金锄头文库上搜索。
逍遥游复习 知识点整理
近现代法德关系史 高三展示课3稿
当代大学生人生信仰及追求的调查研究
长相思 纳兰性德-ppt课件
课件:危机意识 一
英语ppt演讲关于阿甘正传
发达国家基础教育改革的动向与趋势 修改版
中国民间美术 课件.ppt
生物质发电技术与系统 课程ppt 第1章 生物质发电技术现状及发展趋势 2学时 -----2016
现代信号处理思考题 含答案
执业药师继续教育 抑郁症的药物治疗 100分
小学生的成长档案模板不用修改 万能型
增订六版 现代汉语 上册 第二章文字 思考与练习答案
国家财政ppt课件
加拿大英语介绍
六年级统计图的选择课件
中学生成长档案ppt
中国现代文学史期末复习整理
lohi和hihilo训练对女子赛艇运动员运动能力影响的比较研究
风雨贾平凹阅读答案
2024-04-11 25页
2024-04-11 37页
2024-04-11 28页
2024-04-11 31页
2024-04-11 36页
2024-04-11 29页
2024-04-11 22页
2024-04-11 27页
2024-04-11 34页
2024-04-11 32页