好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

灾备业务实施及服务质量评价体系白皮书.pdf

14页
  • 卖家[上传人]:I***
  • 文档编号:150891360
  • 上传时间:2020-11-10
  • 文档格式:PDF
  • 文档大小:318.80KB
  • / 14 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 灾备业务实施及服务质量评价体系 白皮书 目 录 灾备业务实施及服务质量评价 ....................................................... 47 4.1 灾备建设三部曲 ....................................................................................... 47 4.1.1 业务连续性规划 ........................................................ 47 4.1.2 方案设计 .............................................................. 48 4.1.3 方案实施 .............................................................. 48 4.2 灾备演练 ................................................................................................. 48 4.3 专家服务 (ADTIS) .......................................................................................... 50 4.4 灾备服务质量评价 ................................................................................... 52 灾备业务实施及服务质量评价 4.1 灾备建设三部曲 灾备建设的目的是确保用户的业务永续运行,在建设过程中,科学严谨的方法论是确保灾备项 目能够正常运转的前提。

      我们将灾备建设分为三部曲:业务连续性规划、方案设计、方案实施 4.1.1 业务连续性规划 灾备建设的最终目的就是要保护业务的连续性运行,其具体要求需要通过进行业务连续性规划 来确定因此,业务连续性规划是进行灾备建设的大前提,没有业务连续性规划,灾备建设就没有 意义,充其量只能做到数据不丢失,不能及时恢复业务运行 分析各项业务的恢复优先级及其恢复要求(RTO、RPO 以及恢复业务所需的资源等),是业 务连续性规划的工作重心如何进行业务连续性规划,行业有很多种版本,下面我们只列举国际上 目前流行的 DRI 业务连续性管理十大专业惯例: 规划启动与管理 风险评估 业务影响分析 业务连续性策略 突发事件响应 计划编制与实施 认知与培训规划 业务连续性计划的演练、审计和维护 危机沟通 与外部机构的协调 DRI 十大最佳惯例是国际通用 BCM 规划的方法,适用于企业和业务功能,当然也适用于信息 系统业务连续性规划确定了保护业务的各项要求(如 RTO、 RPO 等),支持业务运行的信息系统 自然就要根据这些要求确定相应的信息系统恢复目标和恢复策略 灾备是通过保障业务信息系统的连续性运行来实现业务的正常运行。

      因此,在通过业务连续性 规划梳理出业务的恢复要求和恢复优先级后,就要根据这些要求来梳理支持这些业务的 IT 应用, 同样需要分析出这些 IT 应用的恢复优先级和恢复指标(RTO、RPO 以及恢复所需的资源等) 灾备规划采用的方法与业务连续性规划的方法基本一致,主要区别仅在于前者针对的是支持业 务运行的 IT 应用和系统,后者主要关注的是业务流程这里针对 IT 应用和系统的恢复要求应该与针 对业务的恢复要求相匹配通过灾备规划,确定所有支持业务运行的 IT 系统的各项恢复指标, 并 制定 IT 系统的恢复策略以及 IT 系统的恢复计划 灾备规划时需要考虑风险分析和业务影响分析 风险分析:企业需要根据自身所处环境的实际情况,确定 IT 运行环境中存在哪些无法接受的 物理威胁或者可能发生的灾难,并对灾难发生的可能性、目前可能的防护措施的有效性和该灾难所 威胁的资产价值进行分析,最终得到带有优先级别的需要防范的风险及其分级列表,并制订出可能 的处理方法例如接受该灾难发生时的风险而不进行防范、制订该灾难的预防措施或者采取购买保 险等风险转嫁策略 业务影响分析:在本阶段,通过走访各业务部门的相关人员对各种业务流程进行分析,了解各 种业务流程对企业的重要性和时间敏感性。

      同时根据相关的评判原则,得出在核心流程由于灾难发 生而无法正常进行时企业本身的损失情况 这种损失可能是可以量化的,例如单据的丢失、计算的错误而导致的直接损失;也可以是无形 的损失,例如客户满意度及竞争优势的丢失通过对可量化和不可量化损失的综合考虑,得出各种 核心业务流程对于灾难受损的可容忍程度,并作为确定其恢复优先级的决策依据,最终确定这些核 心业务流程的恢复要求指标,例如 RTO、RPO、DOO、NRO 以及恢复所需的各种资源等 4.1.2 方案设计 结合分析阶段的分析成果,以及企业本身在灾备上的投入,制订企业短期、长期范围内的灾备 策略和目标,并有意识地将企业本身的人员组成和组织架构做出调整以适应策略要求本阶段最为 重要的是制订出灾备的具体实施方案 灾备方案可供选择的范围很大,但所有的灾备方案都必须考虑的因素包括恢复时间、实施与维 护灾备策略所需的投入等灾备恢复时间的需求越短,所需的实施成本就越大,实施难度也就越高 4.1.3 方案实施 有了 IT 系统的恢复方案,只能够保证在灾难发生时,IT 系统的恢复能够支持业务的恢复目标, 但是业务的连续性并不只是 IT 系统的恢复。

      因此,灾备方案在设计中还需要涉及包括办公场地、办 公设备、紧急流程、指挥架构、人员调度等多方面、多部门的综合考虑 只有业务执行过程的每一个环节都达到灾备目标的要求,才能够认为灾备方案的目标得到了满 足因此,需要制定一个完整的灾备计划,来统一协调各部门在灾难发生时的行动计划同时制定 灾备计划时需要确保其与企业业务连续性计划协调一致一般来说,每个企业都应该设立一个由领 导挂帅,各业务部门和 IT 部门联合组成的一个灾备指挥小组 灾备体系的搭建经常需要涉及到公司内多个部门的协调,因此在方案实施的过程中,需要把每 项工作的内容、目标要求、实施的方法步骤以及督促检查等各个环节都做出具体明确的安排,具体 落实到工作分几个阶段、什么时间开展、什么人来负责、领导及监督如何保障等 方案在实施的过程中具有很强的规定性,表现在两个方面: 一方面,方案实施要根据方案分析和方案设计的具体操作流程进行,而不能是随意进行有效 的灾备操作流程往往可以节省大量的时间和减少错误反之,就会带来不必要的损失例如,在虚 拟环境下的灾备系统,就要提前规划需要用几台服务器去虚拟出三十、四十,甚至上百的虚拟服务器, 而 且需要长期运行。

      如果没有好的操作流程,不利于灾备中心的运维 另一方面,方案实施工作具有强制性,一旦开启,相关部门单位就要按照具体计划认真组织实 施,不能马虎应对 4.2 灾备演练 灾备演练是检验灾备成果的最好的方式,如果灾备演练都无法通过,证明灾备项目的建设是失 败的,当潜在威胁事件发生时,不仅灾备项目无法发挥作用,还会耽误数据和系统的恢复进度因此, 灾备演练是非常重要的工作 在具体的业务中,灾备演练是基于不同灾备类别中某一特定的场景而进行的,灾难场景不同、 灾备技术复杂度不同,演练的技术过程与周期也不尽相同 具体的演练包括:系统更新、调整,原有的灾难恢复预案是否仍然有效;灾备系统是否需要进 行有效的更新;系统切换流程、步骤是否有遗漏和错误;灾备系统的切换时间是否可以满足业务的 恢复需要等等 当前,常见的三种灾备演练方式包括: (1)桌面演练 图 4-1 常见的三种灾备演练方式 桌面演练也叫“沙盘推演”,是最基础的灾备演练方式桌面演练工作量小,易于实施,可以 根据实际需求灵活开展,并可以模拟多个场景通过对初始灾难恢复预案的一个理论验证,进而测 试急响应预案和灾难恢复体系的完整性和有效性,使相关人员了解应急响应及业务恢复流程,全面 验证技术及业务管理指挥、流程操作、协调配合等方面的综合能力。

      (2)模拟演练 模拟演练是一种对现有生产环境没有影响的演练方式,由于需要虚拟出较为真实的使用场景, 因此在技术上的要求较高 模拟演练以桌面演练结果为基础,由 IT 部门与相关业务部门参加模拟演练,采用模拟数据和 模拟业务系统运行演练模拟演练的过程高度接近真实灾难发生时的处理过程,通过演练可以检验 灾备系统的可用性、灾难恢复预案的可行性以及增加参演人员对灾难处理过程的感知度与配合的默 契度 (3)实战演练 实战演练需要灾备中心真正接替生产运行一段时间,是在具体设定的灾难场景下,将业务切换 到灾备中心及业务恢复环境,并在完成数据、应用及业务恢复后由灾备系统提供对内对外的业务服 务,原来的生产环境可以进行必要的系统维护或者为灾备环境提供备份支持 作为灾备演练的最高的阶段,实战演练的场景最为真实,更易于发现潜在问题并进一步完善灾 备系统,但随之而来的就是演练成本的提高因此,在实战演练中,也会存在很多挑战,这时,关 键是使其理解并支持演练能够周期性地进行,同时发现问题及时改进才是成功的演练(无论是否用 到真实环境),应避免流于形式的表演 验证已建成灾备系统的可用性、有效性,通过演练结果来修正、补充、完善灾备恢复预案并为 灾备系统的升级建设提供理论依据及数据指标,从而使企业在灾备建设中有据可依,保证建成的灾 备系统能充分实现建设的目的、达到建设的目标。

      这就是灾备演练的意义所在,并敢于考验演练中 团队的决策与指挥能力 4.3 专家服务 (ADTIS) 专家服务是灾备行业常见的咨询服务,以英方为例,已经推出的专家服务业务,旨在减少中间 环节、降低无效成本,并最终实现快速部署、高效可靠的专家级业务服务体系,从 0 到 100,全程 专家指导 英方专家服务的特点包括: 针对性强、效力高、可执行; 阶段划分和决策点明晰; 经验证的模块化实施方法; 终身服务 英方专家服务的 5 个阶段: (1) 项目启动阶段 (Start) 图 4-2 专家服务的 5 个阶段 针对项目的需求、规模,安排、组建专业团队进行咨询服务支持和交付在初步对接之后,正 式启动项目的需求分析、设计、实施和运维阶段 (2) 需求分析阶段 (Analysis) 需要对企业的 IT 现状与应用进行关联分析,并对用户整体灾备目标和投入以及潜在风险进行 有效的评估,包括 RPO、RTO 的相关指标和 IT 系统的整体架构以及业务影响分析,主要以专题会的 形式进行,并且就相关事项形成书面纪要,评估阶段主要以免费的形式进行,但由于评估阶段也需 要投入大量的资源进行对接,因此部分服务会保留收费的权利。

      针对评估的具体结果,在双方合作意向明确的前提下,由专家团队主导进入设计阶段此阶段 将会直接影响项目的最终交付因此,英方将以经验证过、稳定的系统为蓝本提供完善可执行的灾 备设计规划,并在此过程中,积极听取需求方的意见 (3) 规划设计阶段 (Design) 为保证项目的顺利进行,英方将对已经设计好的灾备技术架构进行实地验证,同时保证在测试 的过程中不对用户的现有系统造成影响,测试阶段主要包括软件的具体使用、功能的具体实现以及 灾备演练测试可以修正、优化容灾管理体系的设计,也可以帮助我们评估计划执行人员的快速响 应能力和效率,灾难恢复计划的每一个要素都必须测试,保证其恢复过程的准确性 (4) 建设实施阶段 (Implementatio。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.