管理信息系统:第五章 数据资源管理技术.ppt
47页第五章第五章 数据资源管理技术数据资源管理技术5 5..1 1 数据管理技术的发展历史数据管理技术的发展历史5 5..2 2 数据库技术数据库技术5 5..3 3 数据仓库与数据仓库与 数据挖掘数据挖掘5.1 数据(信息)管理的发展历史一、人工管理阶段 计算机诞生的初期(即20世纪50年代后期之前),这个时期的计算机主要用于科学计算 从硬件看,没有磁盘等直接存取的存储设备; 从软件看,没有操作系统和管理数据的软件,数据处理方式是批处理人工管理阶段数据管理的特点:数据不保存没有对数据进行管理的软件系统,数据的组织方式必须由程序员自行设计一组数据对应于一个程序,数据无法共享5.1 数据(信息)管理的发展历史二、文件系统管理阶段 文件系统阶段是指计算机不仅用于科学计算,而且还大量用于管理数据的阶段(从50年代后期到60年代中期) 在硬件方面,外存储器有了磁带、磁盘、磁鼓等直接存取的存储设备 在软件方面,操作系统中已经有了专门用于管理数据的软件,称为文件系统 文件属于操作系统的范畴。
操作系统将一组相关的字符序列看成一个整体,给它唯一的命名以区别于其它的数据集 凡是具有名字的字符序列都看成是一个文件程序、数据集合等,都是一样的文件 数据文件则是指为了某一特定目的而以一定方式形成的有名字的相关记录的集合文件组织 0001 李 强 男 32机加 铣 0002 刘正一 男 36机加 车 …… ………… …… …… …… 0135 张 克 男 31总装 装1 …… ………… …… …… ……记录值数据项值文件文件系统管理阶段数据管理的特点数据需要长期保存在外存上供反复使用程序之间有了一定的独立性,操作系统提供了文件管理功能和访问文件的存取方法,程序可以通过文件名和数据打交道,不必再寻找数据的物理存放位置5.2 数据库技术数据库是数据组织的高级形式,它是一种对组数据库是数据组织的高级形式,它是一种对组织中的各种主要数据资源进行系统化的组织与织中的各种主要数据资源进行系统化的组织与管理的新技术以求得节简、高效、共享和安管理的新技术以求得节简、高效、共享和安全数据库好比一个数据库好比一个“魔方魔方”通过对基本数据的通过对基本数据的“组织组织”与与“掰动掰动”逻辑,就可以由基本的数据逻辑,就可以由基本的数据单元形成人们所需的各种各样的数据单元形成人们所需的各种各样的数据“图案图案”。
5.2.1 数据库的基本概念一 数据库处理的对象——数据•数据数据::在计算机系统中,各种字母和数字符号的组合、在计算机系统中,各种字母和数字符号的组合、语音、图形、图像等统称为数据语音、图形、图像等统称为数据•数据的型与值数据的型与值 如:黎明(字符型)如:黎明(字符型) 125.35125.35(数值型)(数值型) 2005-01-242005-01-24(日期型)(日期型)•数据结构数据结构( (数据模式数据模式) ) 如:黎明如:黎明 男男 1982-02-19 12001982-02-19 1200二 数据库(DB)的概念 数据库(Data Base,DB)是按一定的组织形式存储在一起的相互关联的数据集合 数据被结构化和标准化后,按照一定的数据模式,以较小的冗余,存储到数据库中为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据、修改和检索原有数据均能按一种公用的和可控制的方法进行5.2.2 数据库的典型技术特点1.数据库在存储数据时是按照预先定义好的数据结构(数据模式)进行存储的2.集成性:数据库集中了各种应用的数据,进行统一的构造与存储3.共享性:数据库中的数据可被不同的应用程序和用户方便地使用4.数据独立性:数据与程序之间依赖性较弱,数据的逻辑结构、存储结构与存取方式的改变对应用程序不构成影响或影响较小5.数据统一管理与控制:数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制1.理解数据库存储数据的方式-1 那个戴太阳眼镜、身上摊本小说的女人,衣服极斯文讲究。
皮肤在东方人里,要算得白,可惜这白色不顶新鲜,带些干滞她去掉了黑眼镜,眉清目秀,只是嘴唇嫌薄,擦了口红还不够丰厚假使她从帆布躺椅上站起来,会见得身段瘦削,也许轮廓的线条太硬,像方头钢笔划成的,年龄看上去有二十五六,不过新派女人的年龄好比旧式女人婚帖上的年庚,需要考订学家所谓外证据来断定真确性,本身是看不出的字数:183)钱钟书《围城》第一章 苏小姐领了个二十左右的娇小女孩子出来,介绍道:“这是我表妹唐晓芙唐小姐妩媚端正的圆脸,有两个浅酒涡天生着一般女人要花钱费时、调脂和粉来仿造的好脸色,新鲜得使人见了忘掉口渴而又觉嘴馋,仿佛是好水果她眼睛并不顶大,可是灵活温柔,反衬得许多女人的大眼睛只像政治家讲的大话,大而无当古典学者看她说笑时露出的好牙齿,会诧异为什么古今中外诗人,都甘心变成女人头插的钗,腰束的带,身体睡的席,甚至脚下践踏的鞋,可是从没想到化作她的牙刷她头发没烫,眉毛不镊,口红也没有擦,似乎安心遵守天生的限止,不要弥补造化的缺陷总而言之,唐小姐是摩登文明社会里那桩罕物——一个真正的女孩子字数:285)钱钟书《围城》第三章1.理解数据库存储数据的方式-2姓名姓名肤色肤色类别类别是否有酒是否有酒窝窝化妆否化妆否特别特征特别特征综合评价综合评价分分……苏文纨101FalseTrue嘴唇嫌薄4……唐小姐302TrueFalse好牙齿5…………………………容貌特征表容貌特征表数据库存放数据必须按一定的数据库存放数据必须按一定的预先定义好的数据模式预先定义好的数据模式存放。
存放因此,数据在进入数据库之前因此,数据在进入数据库之前必须进行必须进行结构化结构化和和标准化标准化处理因而提升了因而提升了数据的质量数据的质量, ,保证了保证了数据处理的效率数据处理的效率肤色肤色类别类别肤色特征肤色特征101白、不新鲜、干滞…………302白里透红、与众不同…………肤色类别表肤色类别表1.理解数据库存储数据的方式-3结构化结构化标标准准化化5.2.2 数据库的典型技术特点1.数据库在存储数据时是按照预先定义好的数据结构(数据模式)进行存储的2.集成性:数据库集中了各种应用的数据,进行统一的构造与存储3.共享性:数据库中的数据可被不同的应用程序和用户方便地使用4.数据独立性:数据与程序之间依赖性较弱,数据的逻辑结构、存储结构与存取方式的改变对应用程序不构成影响或影响较小5.数据统一管理与控制:数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制学生成绩数据库2.理解数据库的集成性学号学号姓名姓名语文语文10011001黎明黎明858510021002王立王立9090………………………………学号学号姓名姓名数学数学10011001黎明黎明909010021002王立王立5757………………………………用户1:漂亮的语文老师用户2:英俊的数学老师学号姓名语文数学英语考核时间1001黎明85907505-06-1-1……1002王立90578505-06-1-1……集中考虑各个用户的信息需求,对数据库进行统一的设计与构造降低了冗余度保证了数据的一致性5.2.2 数据库的典型技术特点1.数据库在存储数据时是按照预先定义好的数据结构(数据模式)进行存储的2.集成性:数据库集中了各种应用的数据,进行统一的构造与存储3.共享性:数据库中的数据可被不同的应用程序和用户方便地使用4.数据独立性:数据与程序之间依赖性较弱,数据的逻辑结构、存储结构与存取方式的改变对应用程序不构成影响或影响较小5.数据统一管理与控制:数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制数据库中的数据可被不同的应用程序和用户方便地使用3.理解数据库的共享性5.2.2 数据库的典型技术特点1.数据库在存储数据时是按照预先定义好的数据结构(数据模式)进行存储的2.集成性:数据库集中了各种应用的数据,进行统一的构造与存储3.共享性:数据库中的数据可被不同的应用程序和用户方便地使用4.数据独立性:数据与程序之间依赖性较弱,数据的逻辑结构、存储结构与存取方式的改变对应用程序不构成影响或影响较小5.数据统一管理与控制:数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制学生成绩数据库4.理解数据库的独立性学号学号姓名姓名语文语文10011001黎明黎明858510021002王立王立9090………………………………学号学号姓名姓名数学数学10011001黎明黎明909010021002王立王立5757………………………………学号姓名语文数学英语考核时间1001黎明85907505-06-1-1……1002王立90578505-06-1-1……学号学号4609100146091002应用程序应用程序1((C语言编写)语言编写)……SELECT 学号学号,姓名姓名,语文语文 FROM 学生成学生成绩数据库绩数据库……应用程序应用程序2((Visual Basic编写)编写)……SELECT 学号学号,姓名姓名,数学数学 FROM 学生成绩数学生成绩数据库据库……学号学号姓名姓名语文语文4609100146091001黎明黎明85854609100246091002王立王立9090………………………………学号学号姓名姓名数学数学4609100146091001黎明黎明90904609100246091002王立王立5757………………………………5.2.2 数据库的典型技术特点1.数据库在存储数据时是按照预先定义好的数据结构(数据模式)进行存储的2.集成性:数据库集中了各种应用的数据,进行统一的构造与存储3.共享性:数据库中的数据可被不同的应用程序和用户方便地使用4.数据独立性:数据与程序之间依赖性较弱,数据的逻辑结构、存储结构与存取方式的改变对应用程序不构成影响或影响较小5.数据统一管理与控制:数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制数据库管理系统(DBMS)为数据提供统一的管理手段,并能对数据的完整性、安全性及并发访问提供必要的控制5.理解数据统一管理与控制5.2.3 数据库管理系统(DBMS)DBMSDBMS:是一种系统软件,负责数据库中:是一种系统软件,负责数据库中的数据组织、数据操纵、数据维护、控的数据组织、数据操纵、数据维护、控制及保护和数据服务等。
制及保护和数据服务等DBMSDBMS是数据库系统(是数据库系统(DBSDBS)的核心)的核心DBMSDBMS实例实例小型小型DBMSDBMS::Microsoft AccessMicrosoft Access、、Visual Visual FoxProFoxPro大中型大中型DBMSDBMS::DB2DB2((IBMIBM)、)、OracleOracle(甲骨文)(甲骨文)、、SQL ServerSQL Server(微软)、(微软)、SybaseSybaseDBMSDBMS应具备的基本功能:应具备的基本功能:1 1.数据模式(结构)定义;.数据模式(结构)定义;2 2.数据存取的物理构建;.数据存取的物理构建;3 3.数据操纵(查询、插入、修改、删除数据);.数据操纵(查询、插入、修改、删除数据);4 4.数据完整性、安全性定义与检查;.数据完整性、安全性定义与检查;5 5.数据库的并发控制与故障恢复;.数据库的并发控制与故障恢复;6 6.数据服务(如:数据拷贝、转存、重组、性能.数据服务(如:数据拷贝、转存、重组、性能监测、分析);监测、分析);数据语言:数据语言: 数据定义语言(数据定义语言(DDL):模式定义、数据物理存):模式定义、数据物理存取构建。
取构建 数据操纵语言(数据操纵语言(DML):数据的增、删、改、查数据的增、删、改、查 数据控制语言(数据控制语言(DCL):数据完整性、安全性的):数据完整性、安全性的定义与检查,并发控制、故障恢复定义与检查,并发控制、故障恢复•按照数据库处理数据的方式可以分为:按照数据库处理数据的方式可以分为: 1.层次数据模型.层次数据模型 2.网络数据模型.网络数据模型 3.关系数据模型(以二维表的方式处理数据).关系数据模型(以二维表的方式处理数据)关系关系=(二维)表(二维)表•关系数据库中的几个关键的基本概念关系数据库中的几个关键的基本概念属性(字段)属性(字段)元组(记录)元组(记录)键:主键、外键键:主键、外键————建立了表之建立了表之间的逻辑关系间的逻辑关系5.2.4 数据库管理大多数应用了数据库的组织需要建立专门的大多数应用了数据库的组织需要建立专门的人员或专职的部门来对数据库进行管理,称人员或专职的部门来对数据库进行管理,称之为之为DBA((Database Administration))DBA的职责探讨:的职责探讨:数据库的设计与开发数据库的设计与开发数据的维护数据的维护数据库的备份与恢复数据库的备份与恢复保证数据库的适应性保证数据库的适应性DBA的技术技能与人际技能要求的技术技能与人际技能要求5.2.5 数据库系统(DBS)与数据库应用系统(DBAS)DBS的组成:组成: 数据库(数据库(DB)、数据库管理系统()、数据库管理系统(DBMS)、数据)、数据库管理员(库管理员(DBA)、硬件平台、软件平台)、硬件平台、软件平台硬件平台:计算机、网络硬件平台:计算机、网络软件平台:软件平台: 操作系统操作系统 数据库系统开发工具(数据库系统开发工具(VB、、PB、、Delphi、、HTML、、XML等)等) 接口软件(接口软件(ODBC、、JDBC、、OLEDB、、CORBA、、COM、、DCOM等)等)DBAS的组成:DBS+应用软件+应用界面数据库系统并不意味着只要购买并安装了一个数据库管理系统就万事大吉了。
数据库设计中的E-R方法对于关系数据模型,一整套规范化的理论--关系规范化理论5.2.6 数据库设计现实世界现实世界认识抽象认识抽象信息世界信息世界 (逻辑)数据模型(逻辑)数据模型计算机世界计算机世界 物理模型物理模型概念模型概念模型数据库的设计数据需求分析概念模式设计逻辑结构设计物理结构设计数据库的实施和维护概念模式设计的工具E-R模型(实体-联系模型)实体、实体集实体、实体集如:小赵、小李如:小赵、小李 实体实体属性属性联系联系 学生学生学号学号COURSEName教学教学SCC#C#COURSECOURSECnCnP#P#学号学号学生学生姓名姓名性别性别SCSC学生学生COURSECOURSEFPUFPU产品产品工厂工厂用户用户学生学生教师教师教学教学管理管理employeeemployee管理管理师生导师研究生教工号教工号姓名姓名职称职称院系院系联系方式联系方式学生号学生号姓名姓名性别性别专业专业联系方式联系方式出生年月出生年月1n教工号教工号逻辑结构设计——关系范式理论(1) 第一范式(First Normal Form,1NF)在同一表中,没有重复项出现(2) 第二范式(2NF) 每个表必须有一个数据元素为主关键字,其它数据元素与主关键字一一对应(3) 第三范式(3NF) 满足2NF且任何一个非主属性都不传递依赖于任何主关键字 规范化理论是E.F.Codd在1971年提出,他和后来的研究者为数据结构提出了5种规范化模式(Normal Form,NF) ,这里仅讨论前3种范式不符合1NF的关系 教师代码姓 名工 资基本工资/元附加工资/元1001李明2 000.002 000.001002王军1 500.001 500.001003张淑红1 100.001 300.00符合1NF的关系教师代码姓 名基本工资/元附加工资/元1001李明2 000.002 000.001002王军1 500.001 500.001003张淑红1 100.001 300.00不符合2NF的教师与研究课题关系教师代码姓 名职 称研究课题号研究课题名系代码系地址01管理工程管理学院41302技术经济管理学院416教师代码姓 名系地址1001李明管理工程管理学院4131002王军管理工程管理学院4131003张淑红技术经济管理学院416教师代码姓 名系代码1001李明011002王军011003张淑红02不符合3NF的关系 符合3NF的关系 数据库存储数据时追求最小冗余度关系范式的基本准则:有冗余就分解师生导师研究生教工号教工号姓名姓名职称职称院系院系联系方式联系方式学生号学生号姓名姓名性别性别专业专业联系方式联系方式 出生年月出生年月1n教工号教工号导师信息表(教工号,姓名,职称,院系,联系方式)研究生基本信息(学生号,姓名,性别,专业,联系方式,出生年月,导师教工号)属性属性数据类型及长度数据类型及长度有效性约束有效性约束教工号(主建)文本,66位数字姓名文本,5不多于5个汉字职称文本,3教授、副教授、讲师、助教院系文本,10 在院系列表中选择联系方式文本,50属性属性数据类型数据类型有效性约束有效性约束学号(主建)文本,88位数字姓名文本,5不多于5个汉字专业文本,10在专业名称列表中选择联系方式文本,50出生年月日期型截至入学时间,不超过40周岁导师教工号(外键)文本,6与“导师信息表”中的教工好相匹配导导师师信信息息表表研研究究生生基基本本信信息息简化的元数据简化的元数据师生导师研究生教工号教工号姓名姓名职称职称院系院系联系方式联系方式学生号学生号姓名姓名性别性别专业专业联系方式联系方式 出生年月出生年月mn教工号教工号导师信息表(教工号,姓名,职称,院系,联系方式)研究生基本信息(学生号,姓名,性别,专业,联系方式,出生年月)师生关系表(教工号,学生号)学生号学生号课堂练习以大学的学生成绩管理为例,设计一个学生成绩管理的数据库。
通过该数据库能够满足任课教师、教务管理人员和学生的各类信息查询和管理的需要要求:分析学生成绩管理的涉及各类用户的数据需求画出相关的E-R图设计相关表的结构,包括各个表的属性、属性的数据类型和有效性约束、主键、外键、表之间的参照完整性约束课后尝试使用Access实现设计的数据库,为每个相关的表输入若干条数据课后实践作业1.假设你在某公司的销售部工作,老板要求你创建一个电子文档来记录与客户的交易信息,现在使用Excel来完成这个目的a.创建一个电子清单表有如下各列:客户姓名、客户地址、交易日期、商品名、单价、销售员、销售员Emailb.假设你有三个客户A、B和C假设A在南京,B在大连,C在广州假设你有两个销售员张三和李四(为每一个人建立一个Email地址)假设有三种产品:P1、P2、P3同一种产品卖给不同的客户的价格都可能不同编造一些交易数据(至少要有20行的样本数据,涵盖了所有的客户、产品和销售人员)假设价格会随时间变化,输入2005年至2006年间的数据c.假设产品P1在2006年更名为P1-Turbo,解释你在Excel中修正这个错误所必需的详细步骤d.一个真实的交易记录中可能有几千、上万条记录,如果面对这样的电子表格,你需要怎样的步骤改正c中的错误?2.上题中的同样问题,假设使用Access来记录交易数据。
a.建立一个数据库,创建3个表:客户(客户姓名,地址),销售员(销售员姓名,Email),价格(日期,产品,价格,客户姓名,销售员姓名),其中,销售员姓名是销售员表的主键为每个属性选择合理的数据类型和有效性约束b.为顾客和价格创建一个1:N的关系,为销售员和价格创建一个1:N的关系,为两个关系都建立合理的参照完整性约束c.利用你在题目1中的数据填表d.客户C的地址变为深圳,你需要修改几条记录e.利用Access的帮助文档,创建一个更新查询,能够把产品P1的名称改为P1-Turbof.比较Excel和Access,在操作方面哪个更好一些?为什么?哪些特性使你选择Access或者Excel呢?将上述问题分别建立一个Excel文档和一个Access文件,将数据和操作结果保存在文件中两个文件均以“学号姓名”的形式命名其中,针对问题1.c、1.d、2.d、2.f撰写一个心得报告,以A4纸、5号字打印,篇幅限制一页报告的页眉写清学号和姓名一、数据仓库数据仓库(Data Warehouse)是在逻辑地表达企业信息的进程中,继数据库之后的又一步进展数据仓库是信息的逻辑集合,这些信息来自于许多不同的业务数据库,并用于支持企业分析活动和决策任务(OLAP),它代表了一种对企业中的信息进行组织和管理的与以往完全不同的思维方式。
1 数据仓库将来自于不同数据库的信息结合在一起 2 数据仓库是多维度的 3 数据仓库支持决策而不是事务处理(OLTP)5.3 数据仓库与数据挖掘二、数据挖掘工具数据挖掘工具(Data Mining Tools)是用户对数据仓库进行信息查询的软件工具,它支持OLAP数据挖掘工具包括查询与报表工具,智能代理和多维分析工具等从本质上讲,DMT是为数据仓库使用的 1 查询与报表工具 通过诸如SQL、QBE 和报表工具进行简单的查询并生成报表 2 智能代理(Intelligent Agents) 应用像神经网络、模糊逻辑等人工智能工具,形成OLAP中“信息发现”的基础 3 多维分析工具 一种横纵分割的技术,允许人们从不同角度观看多维的信息 4 统计工具5.3 数据仓库与数据挖掘。





