好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据仓库应用实现电子教案.pptx

32页
  • 卖家[上传人]:yulij****0329
  • 文档编号:140602802
  • 上传时间:2020-07-30
  • 文档格式:PPTX
  • 文档大小:847.16KB
  • / 32 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据仓库应用实现,,本例采用的是SQl Server2005所提供的商业智能服务和工具,主要包括Analysis Services(分析服务),Integration Services(集成服务),Reporting Services(集成服务)和Bussiness Intelligence Developer Studio(BIDS)1.实现工具,分析服务(Analysis Services) SQL Server 分析服务(SSAS)是一个用于分析数据仓库中数据的工具,它包括了OLAP和数据挖掘工具在SQL Server 2005数据库系统中,Analysis Services工具以服务器的方式为用户提供管理多维数据立方体的服务Analysis Services可以把数据仓库中的数据组织起来,经过预先的聚集运算,加入到多维立方体中(即建立立方体),然后对复杂的分析型访问做出迅速的回答1.实现工具(续),报表服务(Reporting Services) SQL Server报表服务(SSRS)是一个完整的、基于服务器的平台,它可以建立、管理、发布传统的、基于纸张的报表或者交互的基于Web的报表。

      SSRS提供的主要功能有: 为各类客户,跨企业提供并发访问功能 为各类提供数据源支持 针对个人和企业提供提供不同的数据报表分发机制 生成各类形式的报表 可生成多维数据报表,在此基础上可以进一步完成数据分析工作,是真正的企业级报表生成工具1.实现工具(续),Bussiness Intelligence Developer Studio BIDS是SQL Server 2005新增加的一个开发环境,主要用于商业智能解决方案的开发BIDS将开发商业智能所涉及的各个方面(例如数据转换和抽取、基于多维数据集的联机分析、数据挖掘和生成数据报表等)都集成在了一个开发平台上,也就是说商业智能开发人员可以使用BIDS开发出完整的商业智能解决方案 BIDS是一个基于Visual Studio 2005的开发平台,与Visual Studio 2005具有相同的设计界面1.实现工具(续),1.数据源概述 本例以SQL Server 2005提供的AdventureWorks数据库作为商业智能解决方案的数据源 AdventureWorks数据库是SQl Server 2005的范例数据库,它是一个大型的跨国自行车制造企业应用的业务数据库,其用途是帮助企业对自行车的生产和销售进行管理。

      AdventureWorks数据库主要的应用方面有人力资源、产品管理、市场销售、采购和供应商管理、生产管理 AdventureWorks数据库是一个比较复杂的数据库,可以使用Microsoft SQL Server Management Studio打开这个数据库,并查看其中的表格和字段二.数据仓库应用举例,2.需求分析 AdventureWorks数据库设计的方面很多,但是我们的目标很简单,只有以下三个: 需要分析不同类别的产品通过直销在不同地区、不同时间段内销售的业绩 生成分析结果的报表 分析影响客户所有车的数量的因素二.数据仓库应用举例(续),通过目标可以发现分析销售业绩基于的维度有三个:产品、客户和时间,事实数据则为反映销售业绩的订单 对于产品我们关心的是产品的名称和分类,由于产品和产品类别之间有一对多的关系,因此可以将这个维度设计为雪花模型 对于客户,我们主要需要关心客户的姓名、年龄、性别、婚姻状态、孩子的状况、是否拥有房产、拥有汽车的数量,所在的地区、国家、省和城市等信息二.数据仓库应用举例(续),对于时间,我们只关心年、季度和月份,这些在数据库中不是显式存在的,但是可以从订单上的OrderDate字段中计算出来。

      对于事实数据,我们只会关心订单中产品的价格、折扣、数量和总价的情况 可以得到如下需求分析模型:,二.数据仓库应用举例(续),分析模型的事实表、维度表关系,二.数据仓库应用举例(续),3.数据转换和抽取(建立数据仓库) (1)首先使用Microsoft SQL Server Management Studio新建一个数据库Sales_DW作为数据抽取的目标数据库,AdventureWorks作为源数据库 (2)新建Integration Services 项目Integration Sales,并在此项目中新建一个SSIS包Integration Sales.dtsx,在此包中进行数据的抽取,整合等操作二.数据仓库应用举例(续),(3)创建数据源 在Integration Sales项目下的数据源文件夹中添加两个新的数据源连接,一个连接源数据库AdventureWorks,一个连接目标数据库Sales_DW,数据源名称分别为Adventure Works和 Sales_DW (4)设计SSIS包Integration Sales.dtsx 设计包的方法是从工具箱中将需要使用的容器、任务、可执行体等工具拖拽到包的SSIS设计器窗口中,再对这些对象进行设计。

      由于主要执行的是数据抽取工作,因此数据流任务是我们主要设置的任务二.数据仓库应用举例(续),数据抽取中所涉及的表主要有事实表FactSales,产品信息表DimProduct,产品类别信息表DimCategory,订购时间表DimTime以及客户信息表DimCustmer 抽取事实表FactSales的数据流任务的过程 1)选中SSIS设计器的【控制流】标签,将工具箱中的【数据流任务】对象拖拽到SSIS设计器中,并重命名为FactSales 2)双击【数据流任务】FactSales打开【数据流】标签,将【OLE DB源】拖至SSIS设计器上二.数据仓库应用举例(续),打开【OLE DB源编辑器】,进行【OLE DB源】对象的设置二.数据仓库应用举例(续),在上述设计中需选中数据源Adventure Works,并选择数据访问模式为【SQL 命令】,在【SQL 命令文本】中输入进行数据抽取的SQL语句 4)完成【OLE DB源】对象设置后,从工具箱中将【SQL Server目标】对象拖至SSIS设计器上,并选中【OLE DB源】对象,将其绿色连线拖拽至新添的【SQL Server目标】对象上。

      打开【SQL目标编辑器】,选中数据源Sales_DW,并新建表FactSales二.数据仓库应用举例(续),【SQL目标编辑器】对话框,二.数据仓库应用举例(续),完成后的数据流任务视图如下所示: 数据仓库中其他表的数据抽取设计步骤与FactSales相同,只是输入的SQl命令不同二.数据仓库应用举例(续),Integration Sales 包的完整设计视图:,二.数据仓库应用举例(续),(5)建立OLAP和挖掘模型 1)创建OLAP多维数据集数据源和数据源视图 新建项目Sales Analysis,并添加到已有解决方案中在此项目中新建数据源选中已在Integration Sales项目中创建好的数据源Sales_DW 新建数据源视图,选中数据源Sales_DW,并将FactSales、DimCategory、DimCustomer、DimTime以及DimProduct选为视图【包含的对象】,命名此数据源视图为 Sales DW View二.数据仓库应用举例(续),2)创建多维数据集 新建多维数据集Sales OLAP选中数据源视图 Sales DW View,并将FaceSales选为事实表,其他表作为维度表。

      由于时间维度DimTime和客户维度DimCustomer还分别具有时间层次结构和地理层次结构,因此还需要为这两个维度创建层次结构,如下所示:,二.数据仓库应用举例(续),多维数据集Sales OLAP的数据视图和结构,二.数据仓库应用举例(续),3)对多维数据源部署和处理 右击【多维数据集】|Sales OLAP多维数据集,选中【处理】命令 【处理】结果: 处理完毕后,分 析人员就可以使 用Sales OLAP 对数据进行分析 了二.数据仓库应用举例(续),4)使用多维数据集进行销售业绩的分析 双击Sales OLAP多维数据集,选中【浏览】标签,将Total等相应字段拖至浏览器选项页的正确位置,在【筛选表达式】劣种可以选择不同的产品类别,则右下侧表格中的将出现此类别产品的销售业绩二.数据仓库应用举例(续),所有自行车在不同地区不同时间段内销售的业绩,二.数据仓库应用举例(续),5)建立数据挖掘结构和数据挖掘模型 从【现有多维数据集】新建挖掘结构Dim Customer,挖掘技术选择【Microsoft决策树 】 将NumberCarsOwned作为可以预测列,其他列作为输入 右击【挖掘结构】|Dim Customer,选择【处理】命令,完成对挖掘结构的部署和处理。

      单击设计器上的【挖掘模型查看器】标签,在设计器上会显示挖掘结果二.数据仓库应用举例(续),影响客户所有车的数量的因素挖掘模型:,二.数据仓库应用举例(续),为了了解挖掘模型的准确度,可以单击设计器上的【挖掘准确性图标】查看挖掘结构的提升图,直线表示实际值,曲线表示预测的值,这样可以比较挖掘结构的准确度二.数据仓库应用举例(续),(6)创建报表 新建【报表服务项目】,项目名称为【Sales 报表】 本例采用报表设计器创建报表,选择已创建的多维数据集作为数据源,数据源名称为Sales DW 新建报表SalesReport.rdl,为报表新建一个数据集SalesDateSet,数据集的数据源选择前面已建好的数据源Sales DW 在报表设计器中可创建数据集查询视图以及所要生成的报表二.数据仓库应用举例(续),自行车对不同地区的客户在不同时间内的销售业绩(数据集查询视图),二.数据仓库应用举例(续),自行车销售业绩报表【预览】结果,二.数据仓库应用举例(续),结束,谢谢。

      点击阅读更多内容
      相关文档
      2025年中考数学总复习二次函数的图象与性质.pdf 2025年中考数学总复习一次方程(组)及其应用-思维导图.pdf 2025年中考数学总复习一元一次不等式(组)及其应用-思维导图.pdf 2025年中考数学总复习二次根式-思维导图.pdf 2025年中考数学总复习分式-思维导图.pdf 人教新版生物学八年级上册知识点.docx 2025年中考数学总复习习题:7.2 投影与视图.docx 2025年中考数学总复习习题:4.3 全等三角形.docx 2025年中考数学总复习习题:2.2 分式方程.docx 2025年中考数学总复习微专题 第二章 结合传统数学文化考查一次方程(组)的实际应用.docx 2025年中考数学总复习课件:考点知识梳理 2.2 分式方程.pptx 2025年中考数学总复习考点知识梳理 8.1 统计.docx 2025年中考数学总复习考点知识梳理 5.2 第3课时 正方形.docx 2025年中考数学总复习习题:6.3 与圆有关的计算.docx 2025年中考数学总复习习题:1.4 二次根式.docx 四年级下册数学课件-平均数3-北京版 (共15张PPT).ppt 四年级下册数学课件-鸡兔同笼人教新课标(共20 张ppt).pptx 四年级下册数学课件-第三单元 三位数乘两位数 第2课时常见的数量关系|苏教版|苏教版 (共9张PPT).ppt 四年级下册数学课件-第六单元 运算律 第8课时 相遇问题|苏教版 (共8张PPT).ppt 2025年中考数学总复习考点知识梳理 3.4 第2课时 二次函数性质的综合应用.docx
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.