某电信公司大数据分析平台建设实战经验
24页1、,电信业大数据分析平台建设经验,2016年7月,目录,什么是大数据?,2. Variety,4. Velocity,数据类型的多样性 如今的数据类型已经不仅仅是单一的结构化数据,也包括音频、图片、视频等非结构化数据,对数据处理能力提出了更高的要求,沙里淘金,价值密度低 在一段大量的数据中,有益于进行挖掘的数据仅占很小一部分。如何通过强大的计算和算法迅速地完成数据的价值提取,是目前大数据背景下亟待解决的难题,实时性 数据实时采集和处理区别于传统数据,如今已是ZB时代,在如此海量的数据面前,处理数据的效率就是企业的生命,数据量巨大全球在2010 年已正式进入ZB 时代,根据IDC统计:预计2020 年,全球将总共拥有35ZB 的数据量,1. Volume,3. Value,大数据技术是被用于在成本可承受(economically)的条件下,通过非常快速(velocity)的采集、发现和分析,从大数据量(volumes)、多类别(variety)的数据中提取价值(value),从而引起IT领域新一轮的技术与架构的变革。,通信业发展迅速,数字化时代到来,从通信行业发展的历史来看,经历了以语音和
2、增值业务为主的2G时代,语音、流量、终端业务并存的3G时代、再到现在 语音流量、内容与应用、实物商品、数字化服务为特征的4G时代。数据的红利对大数据带来了更高的要求和发展。,以语音及增值业务为主 Voice + VAS,语音、流量、终端业务并存 Voice + Data + Device,语音流量、内容与应用、实物商品、数字化服务 Voice + Data + Content + App + Physical Goods + Digital Services,业务需求和驱动力,某移动公司通过新建公司级大数据云平台,在原有B域的数据来源基础上,引入网络部A口信令、GN、GB口、LTE信令等数据,形成用户互联网特征标签,进一步提升流量经营和精准营销能力。 目前每天原始数据超过100TB,实际有效数据超过40TB,传统平台难以实现,迫切需要建设大数据系统。,目录,M域数据 合同、资产、投资等,O域数据 OMC,网管,Mc、Gn、Gb、Gi、A+Abis等信令,日志,B域数据 Boss、话单、CRM、第三方平台,数据源,数据层,应用层,能 力 层,采 集 层,数据管控平台,数据资产管理,监控管
3、理,安全管理,调度管理,系统管理,统一 ETL 采集,传统技术ETL,HadoopETL,流式计算ETL,ETL可视化管理,统一ETL调度,统一采集,数据共享,文件接口,以原有云经分平台为基础,将大数据平台中数据层、采集层统一规划与建设,复用硬件和基础平台,在共享数据的基础上,逐步实现统一建模的机制,分析用户、业务、数据泛在的相关性,建立公司级统一的大数据平台。,大数据平台整体建设思路,消息服务,经分应用,营销 平台,产品 平台,客户 平台,网分应用,上网日志 查询,网优查询,内部企业管理及 其他对外服务应用,开发管理,开放API,数据分发,即席查询,Spark + Streaming,Gbase数据库 (生产),Gbase数据库 (历史),一经库(DB2),Hbase数据库,关系数据库,GP数据库,建设历程,根据公司现状及面临行业内外的竞争和向互联网思维转型需要,大数据平台建设分三步走: 第一阶段:云试点(已完成):在部分模块试点大数据技术,如hadoop、mpp。 第二阶段:主仓库云化,升级为大数据平台(已完成) :将原经分系统核心仓库完成从传统架构到云架构的演进,从原来只处理B域
4、数据,到处理B、O、M三域数据。 第三阶段:大数据运营(进行中):不断拓展大数据平台范围,引入实时流处理,推展各类应用,通过对外数据互换,具备对外数据服务能力。,近期:平台搭建期,中期:平台演进期,远期:平台完善期,第一阶段 :云试点,第二阶段:仓库云化,第三阶段:大数据,关系型数据库+MPP方案。,MPP+Hadoop,Hadoop+ 实时流处理集群,MPP集群:(复杂脚本、报表等) Hadoop (非结构化数据、大数据),Hadoop(ETL),Hadoop(ETL),Hadoop(存储,计算) streams(流处理) SPARK(基于内存的hadoop运算),MPP集群(存储,计算),原有Etl处理模式,大数据平台系统部署,XX移动大数据平台系统,展示层,Spark + Streaming (80台X86),校园市场,长漫包营销,客户标签,Gbase数据库 (26*X86高配)(生产),Gbase数据库 (60台X86) (历史),管理系统,上网日志查询,渠道选址,营销平台,实时营销,调度管理,元数据管理,管控平台,开发管理平台,维护管理平台,自助分析,互联网域,B域,第三方域
5、,O域,M域,基地平台,数据层,接口层,企业外部,企业内部,接口机( GRFS 4台) 、加载机(GRFS-FPO 3台),指标库(DB2) (2*P780),一经,集团上报,领导报表,Hbase数据库 (60台X86),集团客户,手机阅读,O域ETL处理 (160台IBM Power linux),B域ETL处理 (40*X86),企业级ETL服务(Hadoop),实时监控,实时评估,关系数据库,MPP数据库,共享层,由接口层、数据层、共享层以及展示层组成,接口层负责数据的采集与分发;数据层由Hadoop组成ETL以及由Hbase、Gbase组成的数据存储与计算两部分混搭组成,共享层主要是为提高前台的展示性能而配置的关系型数据库。展示层则是基于大数据分析的各种应用分类。,数据处理分工和数据流向,根据不同平台擅长不同,hadoop、mpp、Nosql、流处理技术分别负责不同的应用处理范围。,数据共享层,数据计算与存储,ETL(Hadoop),一经库,MPP数据库 (生产),MPP数据库 (历史),DWA,ODS,DWD,批量获取,实时获取,流处理,Nosql数据
《某电信公司大数据分析平台建设实战经验》由会员文***分享,可在线阅读,更多相关《某电信公司大数据分析平台建设实战经验》请在金锄头文库上搜索。
《直播平台演艺合作协议》
劳动合同(山东省劳动和社会保障厅制-含附表)
《人民政府投资合同(范本)》
劳动合同(武汉市劳动和社会保障局)
《私人小企业专用劳动合同》
劳动合同书(陕西省人力资源和社会保障厅制)
《代办签证服务合同》
劳动合同(武汉市劳动和社会保障局制)
《养鱼塘转让协议》
《物业管理委托合同(与开发商)》
《汽车维修设备、工具购销合同》
《建筑材料购销合同(范本)》
股份融资协议书(适用于公司融资)
《民办幼儿园教师聘用合同(范本)》
《建设工程施工合同专用条款》
《员工手册范本(工厂车间类)》
《国际贸易合同(模板)》
《特许加盟连锁合同书》
《房屋出租协议(范本)》
《美容院合作协议》
2023-11-14 9页
2023-11-14 28页
2023-11-14 37页
2023-11-15 26页
2023-11-15 32页
2023-11-15 44页
2023-11-15 40页
2023-11-14 32页
2023-11-15 45页
2023-11-14 38页