好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

《大数据专业英语》课件—07Data-Warehouse.ppt

23页
  • 卖家[上传人]:sat****105
  • 文档编号:294504970
  • 上传时间:2022-05-18
  • 文档格式:PPT
  • 文档大小:2.06MB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 大数据专业英语教程大数据专业英语教程Data WarehouseData Warehouse Unit 7ContentsContents New Words Abbreviations Phrases参考译文参考译文New WordsNew WordsNew WordsNew WordsNew WordsNew WordsNew WordsNew WordsNew WordsNew WordsPhrasesPhrasesPhrasesPhrasesPhrasesPhrasesAbbreviationsAbbreviationsListening to Text AListening to Text A数据仓库在计算技术中,数据仓库(DW)(也称为企业数据仓库(EDW)是用于报告和数据分析的系统,并且被认为是商业智能的核心组件DW是来自一个或多个不同来源的集成数据的中心存储库它们将当前和历史数据存储在一起,用于为整个企业中的工作人员创建分析报告存储在仓库中的数据从运营系统上载(例如营销或销售数据)数据在被存储之后、在DW用于报告之前,可能需要进行清理等附加操作以确保数据质量见图7-1)典型的基于提取、转换、加载(ETL)的数据仓库使用临时存储、数据集成和访问层来放置其关键功能。

      临时层或临时数据库存储从每个不同的源数据系统提取的原始数据集成层通过转换来自临时层的数据来集成不同的数据集,将这些转换了的数据存储在操作数据存储(ODS)数据库中然后将集成数据移动到另一个数据库,通常称为数据仓库数据库访问层可帮助用户检索数据参考译文参考译文参考译文参考译文数据经过清理、转换、编目,可供管理人员和其它业务专业人员用于数据挖掘、分析处理、市场研究和决策支持但是,检索和分析数据、提取、转换和加载数据以及管理数据字典的方法也被认为是数据仓库系统的重要组成部分数据仓库的这种宽泛使用更常见因此,数据仓库的扩展定义包括:商业智能工具,提取、转换和加载数据到存储库的工具,以及管理和检索元数据的工具1.优点数据仓库保存源事务系统的信息副本这种架构复杂性提供了以下机会:将来自多个源的数据集成到单个数据库和数据模型中给单个数据库提供更多的数据,这样就可以使用单个查询引擎在ODS中显示数据减轻了由于尝试在事务处理数据库中运行大型、长时间运行的分析查询而导致的事务处理系统中的数据库隔离级别锁争用问题参考译文参考译文参考译文参考译文保存数据历史记录,即使源事务系统没有保存集成来自多个源系统的数据,实现整个企业的中央视图。

      这种好处总是有价值的,在组织通过合并而增长时尤其有用通过提供一致的代码和描述、标记甚至修复错误数据来提高数据质量始终展示组织的信息为所有感兴相关数据提供单一的通用数据模型,而不管数据的来源如何重构数据,使其对业务用户有意义重构数据,使其即使对于复杂的分析查询也能提供出色的查询性能,而不会影响操作系统为运营业务应用程序增加价值,特别是客户关系管理(CRM)系统使决策支持查询更容易编写组织数据并消除重复数据的歧义参考译文参考译文参考译文参考译文2.通用环境数据仓库和市场的环境包括以下内容:向仓库或集市提供数据的源系统;数据集成技术以及准备所需数据的流程;用于在组织的数据仓库或数据集市中存储数据的不同体系结构;适用于各种用户的不同工具和应用程序;必须建立元数据、数据质量和治理流程,以确保仓库或市场满足其目的关于上面列出的源系统,R. Kelly Rainer 表示,“数据仓库中数据的一个共同来源是公司的运营数据库,它可以是关系数据库”关于数据集成,Rainer表示,“有必要从源系统中提取数据,转换它们,并将它们加载到数据集市或仓库中”如今,最成功的公司是能够快速灵活地应对市场变化和机遇的公司。

      这种响应的关键是分析师和管理人员有效和高效地使用数据和信息数据仓库”是历史数据的存储库,这些按主题组织好以便为决策者提供支持一旦数据存储在数据集市或仓库中,就可以访问它们参考译文参考译文参考译文参考译文参考译文参考译文参考译文参考译文数据集市的类型包括依赖、独立和混合数据集市分析处理(OLAP)的特点是业务量相对较低查询通常非常复杂并涉及聚合对于OLAP系统,响应时间是一种有效性度量数据挖掘技术广泛使用OLAP应用程序 OLAP数据库在多维模式(通常是星型模式)中存储聚合的历史数据OLAP系统通常具有几个小时的数据延迟,而数据集市中延迟预计接近一天OLAP方法用于分析来自多个来源和视角的多维数据OLAP中的三个基本操作是:上卷(合并)、下钻以及切片和切块事务处理(OLTP)的特点是大量短的事务(插入、更新、删除)OLTP系统强调在多访问环境中非常快速的查询处理和维护数据完整性对于OLTP系统,有效性通过每秒的事务数来衡量OLTP数据库包含详细的当前数据用于存储事务数据库的模式是实体模型(通常为3NF)规范化是该系统中数据建模技术的标准 参考译文参考译文参考译文参考译文预测分析是使用可用于预测未来结果的复杂数学模型来查找和量化数据中的隐藏模式。

      预测分析与OLAP的不同之处在于,OLAP侧重于历史数据分析,并且本质上是反应性的,而预测分析则侧重于未来这些系统还用于客户关系管理(CRM)4.设计方法4.1自下而上的设计在自下而上的方法中,首先创建数据集市以提供特定业务流程的报告和分析功能然后可以集成这些数据集市来创建综合数据仓库4.2自上而下的设计自上而下的方法使用标准化的企业数据模型设计原子”数据,即最详细程度的数据,存储在数据仓库中包含特定业务流程或特定部门所需数据的维度数据集市是从数据仓库创建的参考译文参考译文参考译文参考译文4.3混合设计数据仓库(DW)通常类似于中心辐射型架构给仓库提供数据的老系统通常包括客户关系管理和企业资源规划,它们会生成大量数据为了整合这些不同的数据模型,并促进提取转换加载过程,数据仓库通常使用操作数据存储,其中的信息被解析为实际的DW为了减少数据冗余,较大的系统通常以标准化方式存储数据然后,可以在数据仓库之上构建特定报告的数据集市5.数据仓库特征有一些基本功能可以定义数据仓库中的数据,包括主题方向、数据集成、时变、非易失性数据和数据粒度5.1面向主题与操作系统不同,数据仓库中的数据围绕企业主题(数据库规范化)。

      主题方向对决策非常有用收集所需对象称为面向主题参考译文参考译文参考译文参考译文5.2集成数据仓库中的数据已集成由于它来自多个操作系统,因此必须删除所有不一致的内容一致性包括命名约定、变量度量、编码结构、数据的物理属性等5.3时变虽然因为操作系统支持日常操作而反映当前值,但数据仓库数据代表长时间(长达10年)的数据,这意味着它存储历史数据它主要用于数据挖掘和预测如果用户正在搜索特定客户的购买模式,则用户需要查看当前和过去购买的数据5.4非易失性数据仓库中的数据是只读的,这意味着无法更新、创建或删除它5.5总结在数据仓库中,数据在不同级别汇总用户可以开始查看整个区域中产品的总销售单位然后用户查看该区域中的状态最后,他们可以检查某个州的个体商店因此,通常情况下,分析从较高级别开始,然后向下移动到较低级别的详细信息参考译文参考译文参考译文参考译文Thank You!Thank You!。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.