好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

机房DCIM方案.docx

39页
  • 卖家[上传人]:油条
  • 文档编号:107395450
  • 上传时间:2019-10-19
  • 文档格式:DOCX
  • 文档大小:2.46MB
  • / 39 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据中心基础设施监控管理(DCIM)解决方案V1.02015年06月12日 39目 录第1章 项目概述 31.1. 项目背景 31.2. 需求分析 41.3. 项目目标 4第2章 系统设计 52.1. 设计概述 52.2. 设计依据 52.3. 系统关键参数 62.4. 系统架构 72.4.1. 物理架构 72.4.2. 功能架构 8第3章 DCIM系统亮点 10第4章 DCIM系统功能 114.1. 个人工作台 114.2. 基础设施监控子系统 114.2.1. 可监控的设备 114.2.2. 设备展示功能 184.2.3. 告警功能 194.3. 能效管理子系统 214.3.1. 能效展示 224.3.2. 能耗分析 244.3.3. 能效控制 264.4. 资产管理子系统 264.4.1. 仓库资产管理 274.4.2. 在架资产管理 284.4.3. 办公资产管理 284.4.4. 资产维保信息管理 294.4.5. 其他资产相关功能 294.4.6. U位检测系统布署预留 294.5. 容量管理子系统 294.5.1. 容量建模 294.5.2. 容量展示 304.5.3. 容量预分配 304.5.4. 趋势分析 314.6. 变更管理子系统 314.6.1. 流程逻辑说明 314.6.2. 变更流程控制 324.6.3. 变更风险控制 324.6.4. 变更数据管理 324.7. 可用性管理子系统 324.8. 报表管理 334.8.1. 预定义常用报表报告模板 334.8.2. 自定义报表报告模板功能 334.8.3. 报表报告管理 33第5章 客户收益 345.1. 基础设施监控回报 345.2. 能效管理回报 345.3. 资产管理回报 355.4. 容量管理回报 35第6章 应用场景举例 376.1. 统一监测 376.2. 报警定位:复杂事件分析CEP 376.3. 节能:幽灵服务发现 376.4. 批量资产预占与上架 376.5. 资产盘点 386.6. 功耗控制与容量优化 38 第1章 项目概述1.1. 项目背景在当前高速信息化发展的时代背景下,数据中心是整个社会信息化的基础。

      数据中心础设施直接影响了数据中心安全、高效、环保、稳定的运行如何维护好机房,及时发现隐患和排除故障,降低管理成本,提高运维效率,控制机房能耗,成为管理者关注的重点对机房管理者来说,存在下列痛点:管理效率低——投产后的数据中心最关注的是稳定和高效,稳定与管理团队的日常运维相关,高效与科学化的监控管理系统相关,此中包含的三要素就是:数据中心——监控管理系统——管理团队由此可知,监控管理系统相当于数据中心和管理团队之间的纽带,管理人员通过监控管理系统去感知数据中心的各项指标参数正常与否,结合数据调整运维流程,应对突发事件目前,绝大多数数据中心投入使用的监控管理系统繁多复杂,且各系统间的相互独立造成信息孤岛;另一方面,现有的许多监控管理系统自动化、智能化程度不够,造成日常运维管理对人力依赖大资产难管理——数据中心管理诸多管理工作中,涉及IT资产上架、下架、维护、盘点等工作十分头疼现有对IT资产的管理主要是依靠人工+简单系统统计来实现,例如定期对在架的资产盘点,在缺乏智能资产管理系统的状态下,处理这些工作对人手依赖程度高,工作内容简单重复,很难保证操作与记录的准确性,导致账实不符容量利用率低——数据中心的配电容量、制冷容量、机柜U位容量决定了该数据中心的计算能力。

      在缺乏有效的管理工具的状况下,IT设备部署需求与数据中心容量实际供给情况难以匹配,导致基础设施容量实际利用率低据Gatener,90%以上的数据中心容量利用率不到70%故障定位难——数据中心管理人员对监控系统的核心关注点在于告警准确性,但实际上因为数据中心本身复杂性高,当一台设备出现故障时,经常引发并发告警因此,在基础设施的管理层面,必须依靠监控系统来精准定位故障,以确保管理人员第一时间知道后迅速处理恢复鉴于以上数据中心管理者所面临的各种痛点,应当采用一套可将:基础设施、资产、容量、日常运维、机房安全性作出统一管理的系统数据中心基础设施管理(DCIM)系统就应运而生,亦是当前数据中心行业发展的必然趋势共济DCIM定义如下:通过监控、分析数据中心基础设施的运行信息(如状态、参数、配置等),帮助数据中心管理者掌握数据中心基础设施运行情况(当前与趋势),管理数据中心资产、基础设施资源(空间、电力、冷量等)、能耗,提高基础设施可用性、资源利用率、管理效率与能效1.2. 需求分析据与用户初步交流,此次机房改造,需完成如下工作:1、 集成原有动环监控系统;2、 新增xxx节蓄电池监测、x台UPS监控;3、 增加移动巡检系统、资产管理、容量管理等管理功能;4、 全部子系统接入DCIM系统,通过DCIM平台对各子系统进行的统一管理。

      1.3. 项目目标为机房布署数据中心基础设施管理系统实现以下目标:1) 实现数据中心基础设施集中监控,全面直观展示数据中心基础设施运行状态,精准定位故障,分析预防故障2) 实现数据中心资产全生命周期智能管理,给客户提供面向企业内部统一的资产管理平台3) 提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等IT服务管理提供数据接口,协助管理员高效运维机房业务第2章 系统设计2.1. 设计概述DCIM系统通过统一的操作平台和统一的通信平台,完成对动力系统(供配电系统)、环境系统、安防系统(包括视频监控系统、红外报警系统)各子系统无缝数据集成,实时获取各子系统监控数据,通过对各子系统监控数据处理、分析及逻辑判断,实现上述各子系统的集中视图、集中监控、集中告警、集中数据分析和统一运维管理对于各子系统集成,采用分布式部署、分散控制原则通过分布式部署系统采集网关,完成各子系统数据采集和分散控制交互,从而达到子系统之间的数据无阻塞交互、各子系统之间实现互通互联DCIM系统作为开放式信息交互平台,能够采用多种方式实现不同子系统厂商产品的信息接入及功能集成,如采用OPC、SDK、Webservice、Socket等多种方式。

      针对机房内分散、相对独立的系统,通过独立部署系统采集网关的方式经由运维网络实现各系统之间的互联互通所有信息汇聚至DCIM系统,DCIM系统对外提供B/S分布式远程访问,在运维网络的任意一台工作站上,运维人员均可采用B/S方式对自身授权范围内的子系统系统进行实时操作整体操控界面采用组态方式,提供多种展示工具,实现动态图形、文字、图像相结合,满足运维人员的查看、查询及管理需要DCIM系统通过系统网关完成各子系统之间的协议对接、标准协议转换、数据转换,实现综合监控系统与各子系统间的通讯联网和数据交互2.2. 设计依据《电子信息系统机房设计规范》(GB 50174-2008)《电子信息系统机房施工及验收规范》(GB50462-2008)《电子计算机场地通用规范》(GB/T 2887-2000)《数据中心基础设施监控白皮书》《数据中心基础设施管理白皮书》《综合布线系统工程设计规范》(GB50311-2007)《供配电系统设计规范》(GB 50052-2009)2.3. 系统关键参数参数类型参数说明容量单台服务器50万测点并发访问200个用户数量大于5000报警数据采集小于6秒命令下发控制小于5秒变化数据采集小于6秒页面响应速度小于1秒在架资产盘点小于10秒运行网络环境内部网络不低于百兆带宽;如需外网方位,需VPN网络做安全控制运行服务器环境不低于如下配置:CPU:Intel® Core? I5以上内存:8G以上硬盘:1T以上操作系统:CentOS 6.42.4. 系统架构2.4.1. 物理架构 DCIM系统物理架构图Ø 数据采集处理层数据采集处理层设计为系统的数据入口,是系统管理所需基础设施数据的来源,其通过提供标准接口及协议,接收原有的监控控系统、新增的资产容量系统以及蓄电池检测系统的监控数据。

      216; 管理服务层管理服务层以下服务:基础设施监控服务、能效管理服务、资产管理服务、容量管理服务、告警告知服务、移动巡检管理服务通过对采集数据进行二次计算,形成上层管理所需的数据随着数据中心管理成熟度的提高,增加功能模块扩展方式拓展运维管理功能,易满足数据中心管理需要,系统支持拓展增加工单管理等模块管理服务层相当于发布各种监视和管理的核心层,作为数据采集层和展示层之间的关键环节,“DCIM系统”是发布上述服务功能的核心216; 展示层展示层提供丰富的展示媒介,包括终端、PC浏览器等;提供2D/3D展示效果;提供友好的用户界面随着应用设备的发展,根据应用需要,在应用层增加展示应用模块2.4.2. 系统性能(1) 测点容量:DCIM系统数据处理容量最大500,000点;(2) 系统中断自恢复:当系统因供电及其他意外非正常中断运行时,系统将从软、硬件两个方面进行自动恢复,即服务器立即重新启动,软件自动启动运行;(3) 系统架构:系统采用分布式、模块化架构;数据的采集、传输、处理相互独立,互不干扰;具有热插拔和主设备倒换功能,技术成熟,运行稳定可靠;(4) IE客户端:最大支持200个IE客户端并发访问;(5) 移动客户端:最大支持50个移动客户端并发访问;(6) 报警数据采集周期:小于5s;(7) 命令下发控制:小于5s;(8) 变化数据采集:小于4s;(9) 页面响应速度:小于4s(远程监控刷新时间);(10) 报警方式:支持页面报警、报警、短信报警(短信网关)、语音报警;(11) 告警发出:小于20s;(12) 数据管理:运行状态、报警信息、系统日志全部记入数据库,可通过数据管理查询。

      DCIM系统实时、准确的显示所有监控信息,系统采样时间由管理人员设定2.4.3. 功能架构系统采用模块化的架构进行设计,确保系统的稳定可靠运行,任何模块出现故障不会影响同级别的其他模块的正常工作;系统采用分布式系统架构,确保系统后续的扩容能力和系统反应速度DCIM系统基于网络分布式部署,运维网络内的任意一台或多台集成工作站,运维人员权限相同时,系统将以相同的界面操作,管理整个机房权限范围内的子系统,并具备授权的所有操作功能当需要增加监控工作站时,可在机房区内的任何地方的运维网上增加网络点、工作站即可,通过系统提供的B/S方式进行管理,以最大限度保护投资,完成监控功能第3章 DCIM系统亮点1) 监控全覆盖,可视化展示基础设施实时状态2) 精细化微环境检测,监控每台IT设备的进风温度3) 复杂事件分析处理,准确定位故障;大数据分析,智能预警4) 资产自动检测,线下资产变更,线上信息自动更新5) U位级资产定位,资产部署维护准确高效6) 在架资产实时盘点,及时提交准确报表7) 数据中心全方位资产生命周期管理,资产说得清、管得住8) 可视化容量管理,直观展示容量使用情况及趋势分析,扩容决策及时准确9) 批量设备预占快速匹配,多套精细部署方案,减少容量碎片10) 设备部署合理,平衡各维度容量综合利用率,避免单项容量短板11) 精细化能效管理,监控每台耗电设备能耗,能效指标计算与对标12) 内置能效分析工具。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.