电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

美团点评数据库智能运维探索及实践

31页
  • 卖家[上传人]:第***
  • 文档编号:62006266
  • 上传时间:2018-12-16
  • 文档格式:PDF
  • 文档大小:4.83MB
  • / 31 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、美团点评数据库智能运维 探索与实践 赵应钢 2017-12-09 大纲 1数据库平台的演变 2现状和面临的挑战 3从自动化到智能化 大纲 1数据库平台的演变 2现状和面临的挑战 3从自动化到智能化 演变历程-人肉+脚本 脚本化工具化产品化自助化自动化 脚本化时代 人少 机器少 流量小 演变历程-工具化 脚本化工具化产品化自助化自动化 工具化时代 脚本封装为工具,工具共享 围绕CMDB管理资产与服务 监控不断完善 工具逐渐丰富: DDL变更工具 SQL Review工具 慢查询采集分析工具 备份闪回工具 演变历程-产品化 脚本化工具化产品化自助化自动化 产品化时代 工具孵化为产品 在易用性、安全性上不断迭代 产品的主要用户为DBA 定位为方便运维 演变历程-自助化 脚本化工具化产品化自助化自动化 自助化时代 效率降低,转变思路,开放授权 DBA从变更中解脱: 每天自助改表200+次 自助查询10000+次 自助申请账号、授权、调整监控 自助下载各种日志 平台走向3个分支: RDS自助平台 DBA管理平台 线下环境操作平台 演变历程-自动化 脚本化工具化产品化自助化自动化 自动化时代 半自

      2、动扩缩容 高可用自动部署 主从自动切换 自动容量评估预警 过载自我保护 大纲 1数据库平台的演变 2现状和面临的挑战 3从自动化到智能化 平台现状 DBA 运维 测试 开发 产品 用户 平台 DBA平台 RDS平台 API 工单客服公告任务系统 基础运维服务 HACMDB初始化 MGW管理DNS管理 日志服务 慢日志 BINLOG 监控服务 链路监控 Falcon 优化诊断 SQL评审 SqlAdvisor 运营服务 DOM 平台质量 扩容升级备份拆分表变更 DB创建账号管理任务管理数据归档机器管理 Processlist 审计日志 深度监控 实时监控 容量管理 DBA周报报警自动处理 服务化治理 线下管理平台MySQLRedisCellarMySQL+NoSQL 挑战1-RootCause定位难 慢查询增多,连接数增多 业务队列堆积,不停重试 数据库性能恶化,所有SQL都变慢 1.数据库是结果还是原因? 2.如何杜绝再次发生? 挑战2-人力和发展困境 成长的烦恼 流量成倍增长 集群不断拆分 开发诉求越来越多 实时性要求不断提高 人力的困境 时间被碎片化 成长遇到瓶颈 业务咨询量暴增

      3、专业DBA越来越贵 突破困境-转型智能化 故障触发隐患驱动 被动接受主动出击 DBA发起和解决系统发起,RD自助 人肉救火智能决策执行 传统运维智能运维 DBA亲临事故现场DBA隐身幕后 大纲 1数据库平台的演变 2现状和面临的挑战 3从自动化到智能化 目标 高效稳定快速 从重复、 繁琐的工作中解 放,转型AI 更稳定、 高可用,专注业 务开发 DBA业务公司 提升技术 保障的效率,降 低成本 思路 采集 分析+预警 报警+处理 采集 分析+预警+执行 报警+分析+执行 传统运维智能运维 方案 预警重要不紧急;报警紧急且重要 预警问题域明确,决策执行思路清晰 报警依赖事故现场链路分析,变量多,决策难,风险大 全面采集;增多预警,减少报警 先实现预警部分智能化;再实现报警部分智能化 采集数据 应用数据 端到端的成功率 响应时间95线、99线 错误日志 吞吐量 系统监控 可支持秒级采样 各种系统参数 cpu、io、net、mem 系统日志 数据库状态 global status processlist innodb status slow、error、general log binlog

      4、变更和发布日志 集群拓扑调整 在线DDL、DML变更 应用端发布记录 DB平台操作日志 分析数据 集群层面 每年新增多少个集群? 哪些集群写入峰值超过5000? 哪些集群? 内部版本不一致 binlog format不一致 主从复制规则不一致 不支持GTID 实例层面 5.5,5.6,5.7占比? qps是否有倾斜? 网卡使用是否有倾斜? 读写比? 容量是否足够? 库层面 哪些DB已经被废弃? 哪些DB被最频繁访问? 哪些DB被跨业务线访问? 表层面 多少个热、冷、大表? 多少个无主键表? 多少个myisam表? 有哪些废弃表、索引? 哪些自增ID将溢出? 数据库画像-整体资源规划 1主20+从的集群增多服务器需要scale up 读增加迅猛,读写比变大推进存储KV化落地 利用率和分布情况影响到采购和预算制定 哪几类报警最多专项治理,各个击破 数据库画像-集群健康评估 支付核心集群,不能降级 历史上最大写入QPS 2000,从库开启 并行复制,无延迟风险,无需拆分 已开启GTID,支持自动切换 所有表都有主键;全部为innodb引擎 10ms慢查询占比小于万分之三 磁盘IO稳定,数据全

      5、部在内存中 最近一个月新增3类查询语句,有一个是 慢查询 topN的查询都基于主键,性能良好 有大事务,可能导致并发问题 数据库预警 通过报表发现隐患 把报警转化为预警 数据库报警TopN 5% 5% 7% 17% 17% 20% 28% Seconds_Behind_Master load.1minPerCPU df.bytes.free Slave_IO_Running Slave_SQL_Running net.if.out Threads_running 主从延迟、容量预警 磁盘空间预警 不单纯的使用百分比;根据趋势进行预测 慢查询预警 报警自动处理-自适应的高可用 自动生成配置文件 自动判断是否启用监控 切换后自动重写配置 从库可自动恢复上线 报警自动处理-基于规则的回调 报警自动处理-基于规则的回调 智能化总结展望 将长期处于自助化、自动化、智能化的交叠前进状态 自动清理 自动加索引 自动扩缩容 自动处理报警 DB平台 自动发现问题自动解决问题 我们在招聘DBA+SRE 为gh-ost贡献issue+patch 为mha贡献issue+patch 开源DBproxy、SQLAdvisor、Zebra、MyFlash等数据库产品 自研分布式KV存储系统Cellar,计划开源 负责外卖、配送、金融、酒旅、猫眼、打车等业务线 邮箱: Q & A

      《美团点评数据库智能运维探索及实践》由会员第***分享,可在线阅读,更多相关《美团点评数据库智能运维探索及实践》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2 2022年小学体育教师学期工作总结 2022年家长会心得体会集合15篇
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.