电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据中台的通用体系架构方案

11页
  • 卖家[上传人]:cl****1
  • 文档编号:432596036
  • 上传时间:2023-10-10
  • 文档格式:DOCX
  • 文档大小:45.30KB
  • / 11 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、数据中台的通用体系架构方案从数据中台的建设、运营角度出发,对数据中台在企业数据应用中的作用进行了分析,把数据中台定位为多个数据应用的共享数据平台。从数据应用及数据治理两个维度分析了数据中台的建设要素,提出了模块化、解耦的数据中台体系架构。数据中台体系架构包含数据存储框架、数据采集框架、数据处理框架。数据治理框架、数据安全框架及数据运营模块,可按照企业应用需求进行组合,能够对单个模块进行扩充,能满足大多数企业数据中台建设的需求。内容目录:0引言1数据中台系统定位2数据中台通用体系架构2.1数据存储框架2.2数据采集框架2.3数据处理框架2.4数据治理框架2.5数据安全框架2.6数据运营框架3结语0、引言进入信息时代,随着数据产业的蓬勃发展,数字化建设如火如茶。“数字中国”“互联网+”等国家战略项目已在资源、可持续发展、环境、行政办公等领域取得了良好的效果。数据是资产、资源,但如何把数据资产、数据资源转化为社会收益和企业利润,还需要多方探索。当前,机构和企业不再建设从源数据采集到分析应用的烟囱式系统,更倾向于数据集中采集、存储,并应用分层建设。这种方式一方面有利于应用系统的快速部署,另一方

      2、面也保证了数据的集中管理与运营,体现数据的资产、资源属性。数据中台的出现补充了数据开发和应用开发之间因为开发速度不匹配而出现的响应力不足等缺陷问题。数据中台是国内学者提出的概念,起始于阿里的“大中台、小前台”概念。阿里的中台是从管理的角度出发,以中台事业部集中数据搜索,技术及产品,数据共享等多个部门的功能。其他组织或企业建设数据中台不一定需要成立中台事业部,但是数据集中治理与提升数据价值转换效率的思路是一致的。有学者提出了一种基于数据中台的数据治理系统,他认为数据中台是一种大数据架构,用来完成数据治理。也有学者认为数据中台并非指大数据平台,数据中台完成数据治理后会形成标准数据,再对数据进行存储,进而形成大数据资产,能够为用户提供高效的优质服务。数据中台的作用已经在生产实践中得到普遍认可。阿里的线上商城离不开数据中台,运营商的项目投资建设、销售品管理及用户管理离不开数据中台,家谱管理也用到了数据中台,但迄今为止没有一个通用的数据中台体系架构能指导各行业的数据中台建设。本文从数据中台建设、管理、维护的角度出发分析数据中台的核心要素,梳理出一个通用的数据中台体系架构,提高数据共享能力,减少各

      3、子系统的功能耦合度,增加功能复用率,减少软件功能的重复开发与投资。1、数据中台系统定位数据中台(DataCentral-Platform)能够用来进行数据治理,利用数据中台实现业务数据的流转,数据流向的梳理,数据质量的清洗,数据提供的能力。根据数据治理协会(theDataGovernanceInstitute,DGI)的定义,数据治理指的是对数据相关事宜的决策制定与权力控制。数据治理的目标是提高数据的质量(准确性、及时性、完整性、唯一性、一致性、有效性),确保数据的安全性(保密性、完整性及可用性),实现数据资源在各组织机构部门的共享,推进数据资源的整合、服务和共享,从而提升企事业单位信息化水平,充分发挥数据资产作用。技术上,数据中台是一种大数据架构,用来完成数据治理,进而支撑线上应用系统建设,挖掘数据隐含价值。本文认为数据中台是一个物理存在的系统,是企业或机构需要建设的位于数据源与数据应用系统之间的一个中间平台。数据中台链接数据后台和数据前后,将无质量的后台数据汇集在一起,形成大数据,通过数据治理,梳理出有效的数据。数据中台是数据三层结构中的中间层,主要功能是负责数据汇集,数据治理和提

      4、供数据能力三方面,为应用服务提供个性化数据服务。这里的数据中台并非指大数据平台,而是指通过数据技术对海量的数据进行采集、计算、存储和加工,并统一标准和口径。数据中台完成数据统一后会形成标准数据,然后再对数据进行存储,进而形成大数据资产层,为用户提供高效的优质服务。数据中台是众多数据应用系统中可集中建设与维护的一个共享数据平台,它是数据生产系统中的一环。数据中台一定具有大数据平台的功能,但大数据平台不需要具备数据中台的功能。数据治理是数据中台及大数据平台不可或缺的核心功能,数据中台需要专门的数据治理子系统。以通信运营商为例,其数据中台定位如下图所示。数据应用系统经营分析系统 验证系统 产品销售数据中台数据治理系统数据源上网日志大数据平台信令监测办公系统图1数据中台的系统定位2、数据中台通用体系架构数据需求千人千面,企业数据应用不断更新迭代,企业的中台系统也需要不断变化,因而,有些学者认为无法创建统一、规范的数据中台模板供其他企业借鉴与使用,企业需根据自身业务的需要,构建适合于本企业发展的数据中台。但是从数字系统的核心任务分析,数据中台一方面对大量上层数据应用系统公共数据处理的部分功能集中

      5、建设,另一方面对数据进行治理,利用算法挖掘数据中的隐藏价值,提升数据质量并开放给其他数据应用系统,所以一个通用的数据中台至少应满足数据应用的中间处理与数据治理。从数据处理与数据治理两个维度出发,本文设计了一个解耦的数据中台体系架构。该数据中台体系架构具有一定的柔性,可按照企业应用需求进行组合,或者对单个模块进行扩充,能满足大多数企业数据中台建设的需求。数据中台的通用体系架构如图2所示。该中台体系架构以减少功能冗余和提高功能复用为原则,把数据中台解耦为6个能够分别独立建设、演进的功能子系统。数据结构与数据处理子系统是数据中台体系架构的核心,数据治理是提升数据价值的重要手段。该数据中台体系架构的通用性表现在以下几点:(1)该数据中台体系架构综合考虑了数据中台的各种要素,参考这个架构进行建设能够有效提升数据资产价值,提供数据及服务的共享。(2)参考这个数据中台体系架构,企业能够一次规划、分步实施,首先建设处理子系统及数据存储子系统,然后根据业务发展需求,逐步补充数据采集、数据安全及数据治理子系统。(3)该数据中台由6个解耦的子系统组成,企业在立项建设时能够灵活组合,每个子系统单独招标建设,也

      6、能够把多个子系统合并招标建设。数据安全 安全门卢安全态势安全能力计装数据处理 数据架构日志收集 日志理点任务调度流程监控 任务管理 异常处理处理工具处理流程数照抽取AI分析数据转换批姓理散据装线源经理消显风列数据查询酒息堆积数据交换密码管理数据清洗密匙管理加解密算法APT报入采集用户权限接口权网数据定级数据配载数据治理 据 且数据开放运营管理数据库采集流式果集日志告警民虫采集认证策略TP 采华日志管理运营图2数据中台体系架构示例数据中台通用体系架构包含数据存储框架、数据采集框架、数据处理框架,数据治理框架、数据安全框架及数据运营框架等六大多数。2.1数据存储框架数据中台的核心是数据,数据通过采集系统获取,然后数据经过处理框架加工,并接受数据治理框架的管理,同时也要接受数据安全管理框架的管理,最后开放的价值数据将通过数据运营框架对外提供数据服务。数据中台的数据架构应该独立规划,并采用合理的技术架构对不同类型的数据进行存储。数据存储框架中,无论数据采用对象存储、块存储还是数据库存储技术,各种中台数据可按照上图所示分类管理,对于不同数据的存储技术本文不再讨论。源数据主要由采集框架进行管理,数

      7、据治理框架按照数据特征把数据简单分为结构化和非结构化数据两大类,而规范化分域数据则是数据治理框架对全量数据的规范化分域整理。宽表数据是数据关联的结果,利用宽表数据能够对人、事、地、物、组等对象进行完整的数据画像,同时宽表数据也能够作为上层模型数据的中间层数据。元数据和标签数据都是对数据的描述,其中元数据用来对数据的客观属性进行表示,标签数据更倾向于管理者对数据的主观表述及等级划分,比如质量等级标签、安全标签、属性标签等。主数据需要在各系统间频繁更新、交换,且需要独立的存储空间进行维护管理。2.2数据采集框架数据中台的采集框架应对纳入数据中台的各种源数据进行统一采集管理。数据采集框架中应提供多种数据采集方式,如文件传输协议(FileTransferProtocol,FTP)采集、数据库采集、接口应用程序(ApplicationProgrammingInterface,API)接入采集、流式采集及网络爬虫采集。同时采集框架应按照数据采集规范对源数据进行预处理,从而去除明显不需要的数据及多余数据,并对采集过程进行管理。虽然数据中台的体系架构没有统一模板,但各企业数据采集框架基本一致。2.3数

      8、据处理框架数据处理是每个数据应用的基本环节之一,经典的数据抽取、转换和加载(ExtractTransformLoad,ETL)处理流程在数据采集预处理、数据整合、数据建模等多个地方均要使用。单独建设数据处理框架有利于数据处理工具组件的集中开发与管理,也有利于数据中台数据处理任务的协调与调度。数据处理框架专门负责数据处理相关的任务,包括批处理、流处理、人工智能(ArtificialIntelligence,AI)分析、数据清洗、数据交换及查询,此外数据处理的相关工具组件可在处理框架中配置。任务调度模块在数据处理框架中处于居中指挥的作用,并对运行的数据处理任务进行监控及异常处理等操作。2.4数据治理框架广义的数据治理不但包含提升数据价值的内容,如数据管理、数据目录、数据质量等,也包含数据安全管理及数据共享服务。数据安全管理与数据价值提升是一个矛盾体,如果由一个厂商或开发团队进行数据安全管理及数据价值提升相关软件的开发,则开发者的操作难免有所偏向,而且矛盾不容易公开,少了冲突也就少了优质的解决方案。另外,数据共享与数据治理的其他内容也存在相同的问题。所以,本文建议数据中台的数据治理框架中不包

      9、含数据安全与共享的相关内容。数据治理框架包含数据目录、数据管理、模型管理、数据质量等4个模块。数据地图、数据资产目录、知识图谱及数据血缘的主要作用是为展示数据的属性及相互关系,所以都纳入数据目录模块。数据模型能提高数据中台对外部应用需求的反应能力,固化的中间模型数据需要专门管理。模型管理包括模型目录、模型血缘及模型地图等。数据管理又能够细分为元数据管理、主数据管理、标签数据管理及源数据管理。数据质量管理模块按照制定的数据标准及数据稽核规则对数据中台中的数据进行质量管理。2.5数据安全框架数据已经成为数据资产,数据安全框架是数据中台必不可少的组成部分。数据安全叠加在数据中台其他功能框架之上,数据采集、处理、交换、共享等每个环节均必须实施安全控制策略。安全框架能够分为日志管理、用户认证、权限管理及加解密等几个功能模块,此外安全全门户也能够对外提供安全能力封装,展示数据中台的安全态势及安全视图。2.6数据运营框架数据中台的核心功能是综合众多数据应用的数据处理及数据治理功能,集中建设、集中管理、减少冗余、增加复用。数据中台的最终目的还是为其他应用或开发者提供数据服务,而对外数据服务功能将直接面向不确定的外部对象,所以单独建设数据运营,一方面有利于针对外部用户提供针对性功能;另一方面,数据运营模块作为用户与数据中台核心数据服务之间的中间层,能够有效隔离外部用户直接控制、接触核心数据及应用,可保护数据中台的安全性及内部功能的稳定性。综合以上因素,数据运营应配置运营门户、能力开放、数据开放及运营监控等功能。(1)运营门户:对数据中台管理者提供管理门户,对开发者提供开

      《数据中台的通用体系架构方案》由会员cl****1分享,可在线阅读,更多相关《数据中台的通用体系架构方案》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.