电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据仓库与数据挖掘实验一数据仓库的构建

12页
  • 卖家[上传人]:206****923
  • 文档编号:91101747
  • 上传时间:2019-06-22
  • 文档格式:DOC
  • 文档大小:285.78KB
  • / 12 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、昆明理工大学信息工程与自动化学院学生实验报告( 2015 2016 学年 第 1 学期 )课程名称:数据库仓库与数据挖掘 开课实验室:信自楼234 2015年11月12日年级、专业、班计科122学号201210405204姓名邹华宇成绩实验项目名称实验一 数据仓库的构建指导教师周海河教师评语该同学是否了解实验原理:A.了解B.基本了解C.不了解该同学的实验能力:A.强 B.中等 C.差 该同学的实验是否达到要求:A.达到B.基本达到C.未达到实验报告是否规范:A.规范B.基本规范C.不规范实验过程是否详细记录:A.详细B.一般 C.没有 教师签名: 年 月 日一、实验目的、内容与要求目的:1理解数据库与数据仓库之间的区别与联系; 2掌握典型的关系型数据库及其数据仓库系统的工作原理以及应用方法; 3掌握数据仓库建立的基本方法及其相关工具的使用。内容:以SQL Server为系统平台,设计、建立数据库,并以此为基础创建数据仓库。要求:利用实验室和指导教师提供的实验软件,认真完成规定的实验项目,真实地记录实验中遇到的各种问题和解决的方法与过程,并绘出模拟实验案例的数据仓库模型。实验完成后,应

      2、根据实验情况写出实验报告。二、实验原理及基本技术路线图(方框原理图)数据库(DataBase,DB)是长期存储在计算机内、有组织的、统一管理的相关数据的集合。DB能为各种用户共享,具有较小的冗余度、数据间联系紧密而又有较高的数据独立性等特点。构成的三要素是数据结构、数据操作、约束性条件。数据仓库是在原有关系型数据库基础上发展形成的,但不同于数据库系统的组织结构形式,它从原有的业务数据库中获得的数据形成当前基本数据层,经过综合后形成轻度综合数据层,轻度综合数据再经过综合后形成高度综合数据层。数据仓库结构包括当前基本数据(current detail data)、历史基本数据(older detail data)、轻度综合数据(lightly summarized data)、高度综合数据(highly summarized data)和元数据(meta data)。数据仓库系统由数据仓库、仓库管理和分析工具3部分组成,结构形式如下图所示:关系数据库数据文件其他数据数据建模抽取、转换装载(ETL)元数据系统管理综合数据当前数据历史数据查询工具OLAP工具DM工具C/S工具数据仓库的逻辑数据

      3、模型是多维结构的数据视图,也称多维数据模型。对于逻辑数据模型,可以使用不同的存储机制和表示模式来实现多维数据模型。目前使用的多维数据模型主要有星型模型、雪花模型、星网模型、第三范式等。ETL过程在开发数据仓库时,占去70%的工作量。ETL过程的主要步骤概括为:(1)决定数据仓库中需要的所有的目标数据;(2)决定所有的数据源,包括内部和外部的数据源;(3)准备从源数据到目标数据的数据映射关系;(4)建立全面的数据抽取规则;(5)决定数据转换和清洗规则;(6)为综合表制定计划;(7)组织数据缓冲区域和检测工具;(8)为所有的数据装载编写规程;(9)维度表的抽取、转换和装载;(10)事实表的抽取、转换和装载。三、所用仪器、材料(设备名称、型号、规格等)操作系统平台:Win 7数据库平台:Microsoft SQL Server 2008四、实验方法、步骤本次实验使用Microsoft SQL Server的示例数据库Adventure Works,用其用户订单模型相关数据建立数据仓库。Adventure Works由来:Adventure Works Cycles,Adventure Wor

      4、ks示例数据库所基于的虚构公司,是一家大型跨国生产公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。1、登录Microsoft SQL Server 2008登录名:localhost2、使用SQL语句构建数据库(1)还原数据库(2)建立数据-建立数据USE cd CREATE DATABASE DW ON PRIMARY ( NAME = NDW, FILENAME = NG:DW.mdf ) LOG ON ( NAME = NDW_log, FILENAME = NG:DW_log.ldf )GO(3)建立数据库:数据库新建数据库(4)建维表USE DW-1、建维表/*1.1 订单方式*/CREATE TABLE DIM_ORDER_METHOD (ONLINEORDERFLAG INT,DSC VARCHAR(20)/*1.2 销售人员及销售地区*/CREATE TABLE DIM_SALEPERSON(SALESPERSONID INT,DSC VARCHAR(2

      5、0),SALETERRITORY_DSC VARCHAR(50)/*1.3 发货方式*/CREATE TABLE DIM_SHIPMETHOD (SHIPMETHODID INT,DSC VARCHAR(20)/*1.4 订单日期*/CREATE TABLE DIM_DATE(TIME_CD VARCHAR(8),TIME_MONTH VARCHAR(6),TIME_YEAR VARCHAR(6),TINE_QUAUTER VARCHAR(8),TIME_WEEK VARCHAR(6),TIME_XUN VARCHAR(4)/*1.5 客户*/CREATE TABLE DIM_CUSTOMER (CUSTOMERID INT,CUSTOMER_NAME VARCHAR(100),CUSTOMERTYPE VARCHAR(20),AGE INT,SEX VARCHAR(2),MaritalStatus VARCHAR(10),YearlyIncome VARCHAR(50),Education VARCHAR(50),Occupation VARCHAR(50),NumberCarsOw

      6、ned INT,TotalChildren INT,COUNTRY_NAME VARCHAR(100),STATEPROVINCE_NAME VARCHAR(100),CITY_NAME VARCHAR(100)/*1.6 订单状态*/CREATE TABLE DIM_ORDER_STATUS(STATUS INT ,DSC VARCHAR(30)/*1.7 客户价值*/CREATE TABLE V_SUBTOTAL_VALUES(ORDER_VALUES_ID INT,DSC VARCHAR(30),MIN_VALUE INT,MAX_VALUE INT)(5)建维度表的ETL-二、维度表的ETL-INSERT INTO DIM_ORDER_METHODVALUES (0,销售人员)INSERT INTO DIM_ORDER_METHODVALUES (1,客户在线)INSERT INTO DIM_SHIPMETHODSELECT ShipMethodID,NAME FROM cd.Purchasing.ShipMethodINSERT INTO DIM_SALEPERSONSELE

      7、CT A.SalesPersonID,B.Name FROM cd.Sales.SalesPerson A,cd.Sales.SalesTerritory BWHERE A.TerritoryID=B.TerritoryIDINSERT INTO DIM_ORDER_STATUSVALUES(1,处理中)INSERT INTO DIM_ORDER_STATUSVALUES(2,已批准)INSERT INTO DIM_ORDER_STATUSVALUES(3,预订)INSERT INTO DIM_ORDER_STATUSVALUES(4,已拒绝)INSERT INTO DIM_ORDER_STATUSVALUES(5,已发货)INSERT INTO DIM_ORDER_STATUSVALUES(6,已取消)INSERT INTO V_SUBTOTAL_VALUESVALUES(1,0-100,0,100 )INSERT INTO V_SUBTOTAL_VALUESVALUES(2,100-500,100,500 )INSERT INTO V_SUBTOTAL_VALUESVALUES(3

      8、,500-1000,500,1000 )INSERT INTO V_SUBTOTAL_VALUESVALUES(4,1000-2000,1000,2000 )INSERT INTO V_SUBTOTAL_VALUESVALUES(5,2000-5000,2000,5000 )INSERT INTO V_SUBTOTAL_VALUESVALUES(6,5000以上,5000,1000000000 )declare day dateTIMESET day=2001-01-01while day2005-01-01BEGINinsert into DIM_DATESELECT CONVERT(CHAR(8),day,112),CONVERT(CHAR(6),day,112),CONVERT(CHAR(4),day,112)+年,第+CAST(DATEname(QUARTER , day) AS VARCHAR(1)+季度,DATEname(weekday , day),case WHEN DATEPART(DAY,day)11 THEN 上旬 WHEN DATEPART(DAY,day)21 THEN 中旬 ELSE 下旬 END SELECT day=DATEADD(DAY,1,day)END INSERT INTO DIM_CUSTOMERSELECT A.CustomerID,G.FirstName,CASE WHEN A.CustomerType=I THEN 个人 ELSE 商店 END,DATEDIFF(YEAR,Demographics.value(declare namespace zhh=http:/schemas.mic

      《数据仓库与数据挖掘实验一数据仓库的构建》由会员206****923分享,可在线阅读,更多相关《数据仓库与数据挖掘实验一数据仓库的构建》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
     
    收藏店铺
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.