电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > PPTX文档下载
分享到微信 分享到微博 分享到QQ空间

实时数据平台技术实践v4

  • 资源ID:55911376       资源大小:1.71MB        全文页数:27页
  • 资源格式: PPTX        下载积分:13金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要13金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

实时数据平台技术实践v4

ArchSummit 全球架构师峰会,京东实时数据平台技术实践 刘彦伟,目录,京东大数据平台介绍 实时数据平台背景 实时数据平台解决方案 关键环节详解 关于平台产品化,京东大数据平台定位,支撑全集团数据业务 全集团数据集中 自助式服务平台模式,京东大数据平台发展历程-技术选型,2011年之前,20112012,2012至今,京东大数据平台发展历程-技术选型,传统商业数据仓库解决方案 弊端 高复杂度计算任务并发性差 海量数据处理能力不足 存储能力有限 扩展性差 成本高 后期遇到的问题 越来越多的ETL任务需要12点后才能完成 任务排队现象严重 基于流量等大数据量的批量计算和复杂推荐类算法基本无法应付 存储达到上限,需不断转移历史数据,京东大数据平台发展历程-工具,脚本+配置文件,分散工具集,一站式消费+多屏可用,京东大数据平台架构,自助式服务平台 支持离线模式流式模式 开源组件+自主研发 通过产品化发挥最大价值 让用户专注于开发,实时数据平台背景,运营场景 实时感知业务运行情况,实现实时决策支持,比如调整营销策略、库房排班等 营销场景 根据用户位置、实时浏览轨迹、商品价格变化等实现精准推荐、广告 Top排行榜:销量排行、热度排行等 优化离线数据仓库数据抽取环节 传统“T+1”模式的数据仓库每天凌晨第一件事就是增量或全量抽取业务数据随着数据抽取任务的不断增长,数据抽取时间成本不断增长,离线计算启动时间不 断被推迟,实时数据平台要解决的几个问题,实时数据采集-数怎么来 数据要全 延迟要低 实时数据存储-数放在哪 数据存储统一 方便使用、高吞吐量 实时数据计算-数怎么算 及时性 支持高复杂度场景,实时数据平台解决方案,实时数据采集 实时数据总线 实时数据分发 实时数据流式处理 准实时数据批量处理 高可用 实现产品化,关键环节详解实时数据采集,实时数据来源 在线系统记录日志 统一的实时日志采集方案 支持数据上报 提供SDK支持用户上报实时数据 基于数据库日志 无需开发 数据最全 优势 几乎覆盖全部业务数据 通过产品化实现用户自助接入 快速新增实时数据,关键环节详解实时数据采集,数据库日志采集方案,关键环节详解高可用的任务调度框架,实时任务调度框架 Magpie 保证任务的高可用 节点不可用时任务自动切换到可用节点 调度框架通过Zookeeper实现各调度节点的无状态 根据CPU,内存,网络资源平衡集群各节点压力 通过分组实现集群内资源隔离 集群规模水平扩展 整合监控,关键环节详解实时数据总线,关键环节详解实时数据总线,实时数据采集与下游数据使用者之间的桥梁 数据共享通道 实现了数据集中、统一了实时数据出口一个支持高吞吐率的分布式消息队列 保障数据的基本可靠性 以Topic为单位存储实时数据对象 基于单分区保障Binlog数据的顺序性 支持数据权限控制,关键环节详解流式处理,离线批量计算 静态数据 规则可变,流式计算 动态数据 规则预设 及时响应,关键环节详解流式处理,流式计算-计算程序从庞大而连续的数据流中提取、过滤、分析数据 实时数据是一个持续的数据流 基于事件触发 并行计算 可靠的消息处理机制,失败后自动重试 及时性高,毫秒级处理延迟,关键环节详解实时计算平台,统一的实时计算平台 基于Storm打造的流式计算平台 提供SDK实现与JDQ的对接,从而通过JDQ获取实时数据 提供可视化的配置管理系统 支持Job的自助上传、测试、发布、管控服务 支持Job的版本控制 集成监控,实现状态、延迟等异常报警 实时查看Job运行日志 实现了公司资源利用最大化,包括人力、技术、硬件等,关键环节详解实时数据分发,从JDQ中消费某一特定数据,并根据用户配置信息将数据分发到HDFS中 日志型文件数据落地为HDFS的文件 Binlog型实时增量数据落地为准实时Hive还原表 基于分钟级时间分区存储 每个分区中一份全量数据 提供UDF获取最新分区 基于实时增量日志每天生成一份拉链表,关键环节详解实时数据分发,准实时Hive还原表的实现思路,关键环节详解准实时批量处理,适用场景 计算逻辑复杂,难以通过流式处理模式实现的实时计算场景 开发人员擅长传统ETL开发或SQL,不熟悉流式处理 可以接受分钟级的延迟 实现方式 每隔固定时间周期(分钟级)批量处理一次 与传统离线数据处理模式相同,学习成本低 依赖 准实时的hive还原表,关键环节详解基于Binlog增量日志的拉链表,改变原有”T+1”数据抽取模式 省去离线抽取环节 基于当天数据库实时Binlog增量日志快速生成离线拉链表 缩短离线计算等待时间,关于平台产品化,愿景 通过产品化降低技术门槛,从而降低大数据消费门槛 让人人都成为数据专家 原则 流程抽象 标准化 功能完备,配置、管控、监控、分析、运营等功能缺一不可 其他 统一风格、统一交互 关注细节 帮助文档+提示+最佳案例 多屏可用,关于平台产品化标准化,关于平台产品化分析,广告一下,京东技术解密的面世,就是京东技术团队首次向业界集体亮相。京东创始人刘强东、腾讯大佬张志东作序鼎力推荐,同样写给产品、运营、管理、品牌商、创业人群。 书中用翔实的内容为读者逐一解答: 如何用技术支撑网站的综合竞争实力; 如何把握技术革新的时间点; 如何应对各种棘手问题及压力; 如何在网站高速运转的情况下进行系统升级等备受关注的关键话题。,扫码下单,

注意事项

本文(实时数据平台技术实践v4)为本站会员(给****)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.