好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

数据中心应急预案(多篇).docx

27页
  • 卖家[上传人]:zha****62
  • 文档编号:328695912
  • 上传时间:2022-07-30
  • 文档格式:DOCX
  • 文档大小:34.69KB
  • / 27 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 数据中心应急预案(多篇)推荐第1篇:数据中心停电应急预案 为进一步加强数据中心用电管理工作,我为大家带来了数据中心停电应急预案 数据中心停电应急预案 提升数据中心应对突发市电失电事件的应急反应速度和处置能力,快速、高效处理停电事件,最大限度减少市电停电对数据中心运营带来的影响,确保数据中心基础设施安全、有效运营,特制订此预案 应急处置预案启动条件:全部市电停电且停电时间超过15分钟仍未恢复,全部市电停电,是指数据中心所属市电全部供电电源进线未事先声明的、非检修、突发性事故或遭人为破坏等原因导致停电 应急方案执行原则如下: 1、沉着、冷静,紧密配合,团结协作 2、当启动应急预案时,需及时通知进驻各业务单位做好启用网元应急方案的准备 3、先联系确认停电原因与时间,再确定应采取的进一步方法与步骤 4、先确认设备当前状态,再进行下一步操作 5、在进行相关应急保障操作时,先进行操作,后接打问询进行解释、说明 应急处理流程如下: 1、确认单路或全部市电停电直流操作电源告警声响、一般照明灯熄灭、事故照明灯处于电池放电照明状态,或动环监控值班人员通知时,应立即检查各高压输入柜的电压表电压指示,确认是否处于单路或全部市电停电状态。

      2、通讯联系确认单路或全部市电停电后,值班人员应协同配合,按照应急预案采取应急措施应急处置完毕后,应及时与本地区供电公司联系,通话时应问清停电的路由、原因、范围、预计停电时长,以及对方的姓名,以备日后记录和查询及时通知应急保障小组成员及总协调人进行故障上报,通知数据中心入驻单位做好采取进一步措施的准备 3、应急物资 (1)应急照明设备 (2)高低压配电系统结构图 (3)设备维护手册 (4)各种柜门钥匙 4、应急处置流程(以双路市电停电,高压油机单边送电,低压联络自投自复为例) (1)确认双路停电,市电进线断路器跳闸 (2)检查油机自启后并机是否成功 (3)如并机不成功需排除故障,完成手动并机 (4)油机并机成功,将单边高压油机进线断路器摇到合闸位,合高压油机进线断路器 (5)将市电进线断路器摇出 (6)高压操作结束,检查油机运行状态,记录相应数据,同时询问供电公司停电原因及时长 (7)检查低压配电设备联动是否正常,设备是否运行正常 (8)检查空调系统冷水机组、水泵及末端空调是否工作正常。

      (9)检查油库油位,是否需要通知供油单位及时补充燃料 推荐第2篇:数据中心防汛应急预案 1 介绍 1.1 编写目的 确保北京3#(通州)数据中心各岗位人员对汛期突发事件具备快速反应能力,做到遇有突发事件有步骤、有秩序地实施各项紧急应对措施,以确保园区范围内各机房客户负载、网络设备、通信保障;各关键设备间、办公区域及公共区域内的人员及设备设施安全 1.2 适用范围 适用于数据中心园区内各建筑物、设备设施运行管理单位——数据中心管理部、物业部、外保队等人员 2 事件级别定义及职责 2.1 事件级别定义 三级事件:园区部分区域因降水出现大面积积水现象,或办公区域、客房区域和其它公共区域的建筑出现渗水现象 二级事件:园区大部分区域因降水出现积水现象,或机房区域的建筑出现渗水、漏水现象 一级事件:洪水 2.2 应急小组成员及职责分工 公司领导:听取情况汇报,了解一级、二级事件的现场状况,对总体进行协调 数据中心管理部负责人:及时了解事件现场状况及造成的影响,负责二级以上事件的现场指挥和协调工作;负责与客户沟通;向公司领导汇报。

      负责事件的评估和对客户的影响,并负责事件善后处理 物业部:及时发现并应急处理事件,二级以上事件应及时报告数据中心管理部负责人,三级事件可以在处理完毕后报告 (处理此类突发事件的主控单位为物业部工程管区暖通空调班组,责任部门为数据中心管理部,其它部门应根据数据中心管理部处理事件的需要提供相应的支持和协助 3 事件处理程序 3.1 三级事件处理程序 1) 暖通空调班组作为主控单位,在发现三级事件后,判断原因; 2) 向物业部负责人及数据中心管理部暖通工程师等应急小组成员报告; 3) 疏通排水管道,清理积水;寻求建筑施工方支持,进行房屋修缮,园区内排水管道的修缮等 3.2 二级事件程序处理 1) 暖通空调班组作为主控单位,在发现三级事件后,立即上报物业部负责人和数据中心管理部负责人; 2) 立即采取应急措施,强电班组检查过水区域是否有漏电情况,判断是否需要采取断电措施,上报数据中心管理部负责人作出决定,以防止人员触电情况发生 3) 遇机房区域漏水情况发生,立即采取堵漏、接水、苫盖设备等措施,避免损失扩大;遇园区大部分积水情况,及时使用沙袋等工具在关键部位设置防水坝,以防水势上涨造成事件升级; 4) 管理部、物业部开始确定事故原因,并对事件损失作出评估; 5) 通报客服中心,及时通知客户并对客户损失作出相应处理。

      3.3 一级事件程序处理 1) 发生险情立即上报相关部门并通报客服中心通知客户; 2) 重要部位构筑防水堤坝; 3) 接应急领导指挥小组通知采取全园区断电处置; 4) 组织紧急疏散或就近到地势较高的楼上避险 3.4 善后处理 1) 如条件允许,主管领导到场主持善后工作的有关事宜 2) 物业部做好所涉及区域的设备设施的排查,进行详细记录 3) 数据中心管理部组织全面检查设备设施运行状态、参数是否恢复到事件前状态,出现异常情况进行及时处理,遇有疑难问题通知设备厂商进行技术支持,确保各系统不受影响,确保客户的机房设备不受影响 4) 安保人员做好消防、安防系统的检查工作 5) 在事件善后工作处理完毕后,由公司统一行使对外収布消息权 4.防汛物资和人员组织 4.1 根据园区现有状况,准备防汛物资防汛沙袋140个,铁锹5把,雪推10把,防水塑料布4卷(4x15米),大扫帚5把 4.2 三级事件由暖通空调班组负责处置,二级以上事件以暖通空调班组为主,其他物业各部门协助 推荐第3篇:数据中心个人总结 篇1:2022年数据中心工作总结 2022年数据中心工作总结 今年来,在公司各级领导及同事们的关心帮助下,数据中心坚持以企业精神塑造自我,以企业文化完善自我,以企业标准提高自我,以企业纪律约束自我,认真扎实地完成了本职工作和上级赋予的各项任务,基本实现了技术立足自我、故障及时排除的工作目标。

      公司数字有线电视、宽带数据和固话三网核心业务系统和设备的维护工作在数据中心,数据中心要保持稳定的运行,需要的专业技术人员一般承担重要业务的数据中心都是有人24小时值守,完全无人管理维护的数据中心几乎没有所以数据中心日常维护工作烦琐,但又很重要随着人们的工作生活对数据的完全依赖,承载数据计算、运行的数据中心正发挥着越来越重要的作用,这更突显出维护工作的重要数据中心的维护工作可分为五大类:一是日常业务类、二是日常检查类、三是应用变更、部署类;四是软、硬件升级类;五是突发故障处理类下面就这五个方面的维护工作进行总结 一、主要日常业务类工作 1、公司的宽带固话业务开通的流程是:营业厅受理-数据中心开通-片区维护员上门安装由此可以看出,所有用户端onu业务是由数据中心开通,这就要求数据中心所有技术员都必须熟悉华为和烽火olt网管系统,仔细认真的开通onu,并配合片区维护员解决用户端故障; 2、vod点播系统片源编码上载,今年累计更新电影和电视剧共630集; 3、根据卫星电视节目调整和变更调整,调整卫星接收机的参数,尽快恢复有线电视节目;经常联系和沟通兵团电视台、开发区电视台、石油电视台技术人员,保证互传电视节目的调整、变更和恢复尽快进行;目前给我公司共有158套电视节目; 二、日常监控检查类工作 “千里之堤,溃于蚁穴”。

      任何的故障在出现之前都可能会有所表现,小的隐患不消除,可能导致重大的故障出现,所以数据中心日常的例行检查工作枯燥,但也很重要,可以及时发现一些运行中的隐患根据数据中心承载业务重要性的不同,要对数据中心里的所有运行的设备进行例行检查一些数据中心设备厂商提供了检查软件,比如网管软件,安全防护软件等可以利用这些软件对数据中心网络进行检查,看日志是否有异常告警,网络是否出现过短时中断等通过网络探测软件看网络质量如何检查服务器应用服务是否正常,cpu内存等利用率是否正常这些检查每日都要重复检查,一旦有异常及时处理与消除 对数据中心的机房环境也要进行检查,环境的温度、湿度、灰尘是否合乎要求空调、供电系统进行运行良好,设备运行是否过热,地板、消防、监控都是检查的部分不合理的地方要及时进行整改一个小故障可能因为不熟悉导致大故障,因此日常检查绝不能应付,虽然需要不断重复,在持续的检查过程中,将会对数据中心的理解越来越深,这样每次检查都会有新的发现,在检查中进行学习 三、应用变更类工作 数据中心承载的业务不会是一成不变的,随着业务的多样化,经常要对业务进行调整,包括服务器和网络的设置。

      因此要对服务器和网络设备操作很熟悉,主要需要掌握服务器命令和网络协议要根据应用的需要,做出变更这时就对维护人员提出了更高的要求,不仅是对数据中心原有业务要非常熟悉,还要对新上的应用业务有正确的理解,这样才能在不影响原有业务的基础上做调整这样的应用变更每个月可能都要做几次,是数据中心维护人员的必修课,突显了一个技术人员的基本技能水平这时要对设备操作命令比较熟悉,懂得如何实现业务,要经常和设备厂商的技术人员打交道,通过交流尽快掌握设备操作方法同时,由于设备厂商对应用业务缺乏了解,这就需要维护人员在应用业务和设备具体实现之间做好协调,处理以最快的时间和最小的代价完成应用业务部署如,去年公司只有联通宽带固话业务,新增加铁通和电信的宽带和固话业务,需要数据中心技术员联系厂家技术员如何对用户端onu升级才能开通业务,并教会片区维护员随着用户增多,原有的数据网络规划已不能公司未来业务发展和网络安全需求,因此,今年公司请代维公司对公司数据网进行重新规划,核心网络合理化,安全性提高,实现每用户每vlan,符合未来业务发展和网络安全需求 四、软硬件升级类工作 数据中心的设备一般运行周期是五年,不断地有设备需要逐渐淘汰进行更换,如机房原有一台08年采购的空调已老化,不制冷,必须淘汰,今年7月采购一台机房专用精密空调机房未来5年发展的需要;一些08年采购卫星接收机不开机或无法锁定接收参数,更换为备用的接收机。

      也有一些设备因为存在软件缺陷需要升级,因此软硬件升级也是维护工作的一部分,尤其是软硬件出现故障时,就必须要进行更换有时为了不影响业务,往往还需要设备厂商提供软件补丁来解决问题如vod点播系统、烽火olt网管系统等今年都进行过升级,数据中心的设备很多,出现软硬件故障很正常,所以要不断地进行软硬件升级,这类工作往往都要在业务量最少的凌晨之后进行,维护人员通宵熬夜是常有的事如今年核心设备更换调整、数据网扩容升级都是在深夜进行 五、突发故障类工作 没有任何一个数据中心。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.