上海银行业务连续性建设交流.ppt
36页1© Copyright 2008 EMC Corporation. All rights reserved.上海银行业务连续性建设交流 童童 臻臻Senior Practice Consultant, CBCP2© Copyright 2008 EMC Corporation. All rights reserved.内容提要内容提要金融业BC/DR的合规性要求EMC业务连续性框架和灾备建设方法论灾备建设关键步骤及经验分享 3© Copyright 2008 EMC Corporation. All rights reserved.灾难恢复等级:•实现远程数据实时备份,实现零丢失•应用软件可以实现实时无缝切换•远程集群系统的实时监控和自动切换能力•实现远程数据复制技术•备用网络也具备自动或集中切换能力6 6级级-数据零丢失和远程集群支持•配置所需要全部数据和通讯线路及网络设备,并处于就绪状态•7*24 运行;更高的技术支持和运维管理5 5级级-实时数据传输及完整设备支持•配置部分数据,通信线路和网络设备•每天实现多次的数据电子传输•备用场地配置专职的运行管理人员4 4级级-电子传输及完整设备支持•预定时间调配数据,通信线路和网络设备•备用场地管理制度•设备及网络紧急供货协议3 3级级-电子传输和部分设备支持 •每周至少做一次完全数据备份•制定介质存取、验证和转储的管理制度•完整测试和演练的灾难恢复预案2 2级级-备用场地支持1 1级级-基本支持 2007年年11月月1日日颁布布《《信息系信息系统灾灾难恢复恢复规范范》》中所定中所定义的灾的灾难恢复恢复等等级((GB/T 20988-2007))法规遵从-国家标准法规遵从-国家标准4© Copyright 2008 EMC Corporation. All rights reserved.2009年6月1日《2009商业银行信息科技风险管理指引》(替代原银监发[2006]63号)《商业银行数据中心管理办法》2010年2008年2月中国人民银行颁发《银行业信息系统灾难恢复管理规范》(JR/T0044-2008)•第一类:RTO<6小时,RPO<15分钟;•第二类:RTO<24小时,RPO<120分钟;•第三类:RTO<7天)法规遵从-行业规范法规遵从-行业规范5© Copyright 2008 EMC Corporation. All rights reserved.国际监管要求•Hong Kong Monetary Authority •Guideline9.3 :Banking Ordinance - Internal Control System•Supervisory Policy Manual•TM-G-2 Business Continuity Planning•The New Basel Capital Accord 巴塞尔协定巴塞尔协定II•February 2003 “Sound Practices for the Management and Supervision of Operational Risk,” :Principle 7、、Principle 10 •August 2006 “High Level Principles for Business Continuity”•Sarbanes-Oxley Act of July, 2002•management will be held responsible for ensuring that adequate internal controls are in place6© Copyright 2008 EMC Corporation. All rights reserved.内容提要内容提要金融业BC/DR的合规性要求EMC业务连续性框架和灾备建设方法论灾备建设关键步骤及经验分享 7© Copyright 2008 EMC Corporation. All rights reserved.业务连续性管理框架业务连续性管理框架业务连续性管理框架风险管管理理业务连续性管理性管理组织结构构应急响急响应和操作和操作业务影影响响分分析析维护与演与演练认知与培知与培训危危机机沟沟通通外外部部协调业务连续性策略性策略业务操作操作恢复恢复信息系信息系统恢复恢复BCM Framework-Consolidated from DRII, BCI Methodology8© Copyright 2008 EMC Corporation. All rights reserved.启动 & 准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划10灾备系统实施11制定灾难恢复预案12培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16灾备系统详细设计9EMC BCSI方法论,为业务连续性建设提供系统、科学的指导EMC BCSI Framework9© Copyright 2008 EMC Corporation. All rights reserved.EMC BC服务框架如何为客户提供帮助?Tools &Job AidsDeliverableStepActivityTask分析设计模板和工具10© Copyright 2008 EMC Corporation. All rights reserved.内容提要内容提要金融业BC/DR的合规性要求EMC业务连续性框架和灾备建设方法论灾备建设关键步骤及经验分享 11© Copyright 2008 EMC Corporation. All rights reserved.灾备建设中的重要工作内容灾备建设中的重要工作内容分析规划设计实施管理项目管理(PMO)总体架构咨询(Architect/Consultant)风险分析业务影响分析应用关联分析BC认知培训当前恢复能力评估制定业务连续性策略IT现状分析制定BC技术需求DR架构设计DR技术评估和选型灾备技术实施规划软硬件基本安装配置DRP设计DR与IT运维管理的结合灾备系统技术测试DRP优化和修订灾备演习培训和宣传技术验收主机存储网络数据复制应用数据库DR技术实施和文档备份迁移灾备演习规划系统优化回顾现有的BC规划灾备机房选址数据分类系统整合评估数据中心耗电评估灾备机房设计制定日常运维计划12© Copyright 2008 EMC Corporation. All rights reserved.启动 & 准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划10灾备系统实施11制定灾难恢复预案12培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16灾备系统详细设计9EMC BCSI方法论,为业务连续性建设提供系统、科学的指导规划阶段规划阶段13© Copyright 2008 EMC Corporation. All rights reserved.IT现状及应用关联分析现状及应用关联分析ü调研现有的主机系统、存储系统、网络系统等的架构、配置、部署情况、关键的参数设置ü分析应用与IT系统映射ü分析应用之间的数据传递和相互依赖关系ü分析业务应用与外部单位的关联关系ü分析关键业务数据的分布和保护状况IT 基础设施核心及配套核心及配套系统系统前置系统前置系统外围系统外围系统渠道类系统渠道类系统代理类系统代理类系统管理分析类管理分析类系统系统各种生产运营服务各种生产运营服务了解自己是成功的第一步14© Copyright 2008 EMC Corporation. All rights reserved.业务依赖、应用关联分析示例一业务依赖、应用关联分析示例一哪些业务不能进行?各对口业务部门要有哪些行动?是否需要向上级部门报告?谁负责报告?报告流程?IT系统恢复是否各业务就可对外开放?怎么验证IT系统正常、数据一致?(验证参与范围、验证范围)如果发生数据丢失该如何处理?假设:假设:中间业务平台故障停顿15© Copyright 2008 EMC Corporation. All rights reserved.应用关联分析示例二应用关联分析示例二16© Copyright 2008 EMC Corporation. All rights reserved.业务影响分析业务影响分析p 定义关键的业务功能和业务流程p 确定RTO/RPO• 业务需求• 数据追补的能力• 人工替代业务操作的能力p对应用系统进行分类和排序 •财务影响•非财务影响业务影响业务影响程度程度<4 小时1天7 天30天时间业务连续业务连续成本成本Cost vs ImpactCost vs Impact找到平衡点,获取灾备建设的需求17© Copyright 2008 EMC Corporation. All rights reserved.同级灾备:灾备中心的IT系统在处理能力、可靠性等指标和生产中心相当。
降级灾备:灾备中心的IT系统在处理能力、可靠性等指标低于生产中心灾备系统建设优先级和目标灾备系统建设优先级和目标业务支撑系统业务支撑系统访谈评分访谈评分优先级别优先级别RTO(h)RPO(m)灾备水平灾备水平核心综合业务系统378120同级大前置系统356120同级现代支付系统289120同级信用卡系统280120同级国际业务系统2782430同级网银系统2852430同级个贷系统2362430降级票据影像系统2143248h降级征信系统2043248h降级示 例18© Copyright 2008 EMC Corporation. All rights reserved.风险分析风险分析自然灾害、基础设施故障物理安全物理安全逻辑安全逻辑安全应急响应计划应急响应计划业务连续计划业务连续计划信息系统信息系统资产资产灾备体系灾备体系本地保护策略本地保护策略和恢复能力和恢复能力人为失误硬件故障系统升级失败软件故障19© Copyright 2008 EMC Corporation. All rights reserved.制定灾备建设策略制定灾备建设策略ü灾备规划符合业务的需求吗?最终使用部门会认可我们的灾备项目建设成果吗?ü灾备规划真正领会、贯彻了管理层的意图吗?ü监管部门对灾备建设有什么实质性的要求?•银监会•人民银行ü按什么样的路线去分步实施、逐渐完善灾备体系?20© Copyright 2008 EMC Corporation. All rights reserved.制定灾备建设策略-数据中心选址制定灾备建设策略-数据中心选址防范哪种影响范围和类型的风险是灾备中心选址的重要依据之一清晰界定同城灾备中心和异地灾备中心的定位和职能商业银行数据中心管理办法第3、7、19~22行业规范7.3.1和国家标准7.2.1“生产中心与灾备中心的场所应保持合理距离,避免同时遭受同类风险。
可防范建筑物级别和小区域范围风险,如建筑物火灾、小范围停电、交通或通信系统中断等事件省级分支机构数量在五个(含)以上、资产规模一千亿人民币以上的法人商业银行,应建立异地模式灾备中心21© Copyright 2008 EMC Corporation. All rights reserved.制定灾备建设策略-数据中心布局制定灾备建设策略-数据中心布局物理拓扑•并行•串行•环形运行模式•主备•双活•交替职能定位•大同城小异地•大异地小同城数据中心布局数据中心布局22© Copyright 2008 EMC Corporation. All rights reserved.统一规划、分布实施统一规划、分布实施示 例演进路线演进路线灾灾备建设策略备建设策略- -分布实施路线分布实施路线23© Copyright 2008 EMC Corporation. All rights reserved.方案设计-数据复制技术选型方案设计-数据复制技术选型数据的复制保护是灾备技术中最核心的部分数据的复制保护是灾备技术中最核心的部分信息的载体:磁盘阵列信息的传输:SAN网络信息的驱动:操作系统信息的处理:数据库信息的应用:业务系统中间件编程实现备用数据库技术、或数据库日志传送技术OS逻辑卷镜像或复制基于智能光纤交换机技术基于磁盘阵列复制技术需编程实现,切换及回切复杂,扩展极复杂。
对主机性能有影响,切换及回切复杂,扩展复杂;只能复制数据库信息实现复杂,主机性能影响较严重,管理复杂,支持异构存储不占用主机资源;对应用及主机透明, 扩展容易,存储系统可异构,应用越来越广泛不占用主机资源;对应用及主机透明,切换/回切容易, 扩展容易,存储系统不可异构目前普遍采用24© Copyright 2008 EMC Corporation. All rights reserved.灾备技术选型原则灾备技术选型原则ü采用的技术成熟、可靠,需要有大量的实际应用案例做参考ü采用技术能满足具体业务RTO、RPO要求,并能适应传输网络带宽要求ü采用的技术简单、实用,避免管理的复杂化ü尽量减少对生产系统的性能影响ü采用的技术成本适度需要考虑现有的应用和系统状况、投资规模、实施后的管理要求等因素需要考虑现有的应用和系统状况、投资规模、实施后的管理要求等因素灾备架构设计灾备架构设计25© Copyright 2008 EMC Corporation. All rights reserved.生产中心生产中心同步数据复制同步数据复制异地灾备中心异地灾备中心同城灾备中心同城灾备中心异步数据复制异步数据复制灾备架构演变:多点灾备26© Copyright 2008 EMC Corporation. All rights reserved.灾备架构演变:多点灾备生产中心生产中心同步数据复制同步数据复制异地灾备中心异地灾备中心同城灾备中心同城灾备中心异步数据复制异步数据复制异步数据复制异步数据复制27© Copyright 2008 EMC Corporation. All rights reserved.三点灾备案例序号序号用用户名称名称应用用项目目产品品容量容量三点架构三点架构备注注1交通银行网银、卡处理交易系统等12套系统DMX2000,DMX1000,DMX100010TBMulti-Hop上海-武汉,Open2兴业银行核心系统3 * DMX-39TBMulti-Hop福州-上海3民生银行核心系统3*DMXMulti-Hop北京—深圳4深圳发展银行核心系统3 * DMX-10005TBMulti-Hop深圳-北京,Open &MF5徽商银行核心系统/支付/综合前置等DMX2000、DMX4、DMX310TBMulti-Hop合肥-杭州6福州商业银行核心系统/支付/综合前置/结算3 * DMX-310TBMulti-Hop 7工行海外数据中心 工银亚洲核心交易系统DMX1000、Symmetrix 8430 * 24TB Multi-Hop 8招商银行核心系统DMX2000, 2xDMX38TBSRDF/Star深圳-南京9广东发展银行 3* DMX4 广州-深圳,Open10里昂证券亚太恒富(CLSA Capital Partners,位于香港)核心系统3 * DMX3 SRDF/Star香港-行加坡14江苏移动BOSS DMX1000+2 X DMX2000140TBMulti-Hop 15公安部全国人口数据库系统DMX2000,DMX1000,DMX2000150TB raw concurent 16西门子中国ERP系统DMX-3,DMX1000,DMX100080TB rawconcurent 16江西国税综合征管系统DMX3000,DMX800,DMX-380TB raw concurent 28© Copyright 2008 EMC Corporation. All rights reserved.启动 & 准备组建项目团队B项目规划A业务影响分析2风险分析3调研相关的法规要求1IT现状分析4应用关联性分析5制定灾备策略7可行性和成本效益分析6规划管理建设项目管理灾备架构设计8制定实施规划10灾备系统实施11制定灾难恢复预案12培训13规划和实施灾备演练14灾备更新及维护15构建灾备中心日常运维流程16灾备系统详细设计9EMC BCSI方法论,为业务连续性建设提供系统、科学的指导建设阶段建设阶段29© Copyright 2008 EMC Corporation. All rights reserved.灾备系统详细设计和实施规划灾备系统详细设计和实施规划ü依据灾备策略和总体架构设计,对IT基础架构各部分进行详细的设计,包括:•服务器详细设计•网络详细设计 •SAN详细设计•存储详细设计•应用详细设计•监控详细设计•域管理详细设计•。
ü灾备实施规划•生产改造方案•灾备中心部署方案30© Copyright 2008 EMC Corporation. All rights reserved.PreparationPhase 1Phase 2Phase 3设备到货期高阶实施计划高阶实施计划业务影响分析项目规划组建项目团队调研相关的法规要求风险分析可行性和成本效益分析IT现状分析应用关联分析制定灾备策略灾备架构设计灾备系统详细设计(应用/数据库/服务器/存储/网络)灾备系统实施设计和开发灾难恢复计划认知培训演习规划灾备演练建立灾备中心运行管理组织结构及流程技术招投标技术和流程培训灾备机房建设里程碑Phase 431© Copyright 2008 EMC Corporation. All rights reserved.设计灾难恢复计划设计灾难恢复计划应急响应计划(ERP)–灾备管理组织–灾难初始评估流程–灾难宣布流程–灾难评估流程灾备恢复计划(DRP)–IT切换流程/步骤/启用条件–IT回切流程/步骤/启用条件本地恢复计划–本地保护操作流程/步骤–本地恢复场景及恢复流程/步骤/启用条件业务恢复计划(BRP),主要关注以下内容:–手工替代方法–业务验证–数据追补32© Copyright 2008 EMC Corporation. All rights reserved.灾备演习灾备演习演习方法演习方法Continuous Testing确定演习策略记录演习和收集反馈规划演习准备和协调演习实施演习分析和评估演习结果汇报演习结果Continuous Improvement修改及完善33© Copyright 2008 EMC Corporation. All rights reserved.灾备中心管理灾备中心管理灾备运维的特点灾备运维的特点基础设施–外包的管理–业务恢复座席–物业、后勤、物流人员问题–编制–技术能力培训–岗位如何设置如何保持与生产中心同步更新灾难预警、切换的接口流程–管理制度如何匹配应急、灾难恢复预案如何保证灾备的有效性–周期性演练运维管理体系可参考标准运维管理体系可参考标准ISO 20000ISO 27001ISO 9001COBIT管理制度分类管理制度分类安全管理日常维护和操作配置管理变更管理问题管理SLA运行报告、日志34© Copyright 2008 EMC Corporation. All rights reserved.灾备建设的难点和关键点人手不足•项目专职人员不足;灾备专业人员不足合规性•银监会、人行•与国际标准接轨,行业领先灾备需求的确定•了解自己的IT,应用关联分析•业务需求合理期望值的把握如何构建可持续的灾备技术体系架构•架构合理、一致、支持持续发展•与现有技术手段和日常管理机制的结合灾备中心的管理•面临人员角色转变和工作内容的变化•未来多中心运行的体系架构(技术、管理)整体团队的能力•咨询方的专业人员投入、综合能力•厂商的人员管理关键任务的执行•业务影响分析、灾备技术方案、灾难恢复预案、灾备演练的规划和实施、项目管理灾难切换策略•启用条件、切换单元、优先级、网络灾备演练•演练策略和方案;演练的筹备和组织;指挥和沟通;回切灾备系统的管理•各系统配置信息;应用关联信息;资源配置对应关系;灾难恢复预案;变更管理咨询成果落地,团队建设和培养•咨询成果和方法的转移•灾备技术上的技能、业务连续性管理上的技能35© Copyright 2008 EMC Corporation. All rights reserved.36© Copyright 2008 EMC Corporation. All rights reserved.MajpjMVcyzj21HLfrvy96dv02lPPfYgxUS7IYmZkyEmZ0kGeYZS3bpLCkYH1lt4EK7CxmUX3ijoYSOer7ZuaVWYgz4EpZrUirVpMzzvNtf1XZw5oswSXOtFaejnOcmfE1lZgnN1RSXg8wLCG8CVQ3XPJMvodPFWcpiYJgZazNSEPNIaklYSu7qSd1UpaxmZDlpN9zW7kljfsLCLi26Yv109ffbnDH8LbUN1G6ACURQ39eG12KHL9tXsZ1jzgoCK8g1kuNOh5eFvcmVT5ZYVQt9zk3rp3qLnf02FovEXxVRxjCcFRNppiJljNiOuk6fONnyX7fyGg7sXZ49BmCN5oy9VesHpKzdjTKwjrkCEQCFDehVmGax3lrOEbw63VscA3YSijtUKoCyiLzAlVRp7l4QgPNHxvJFFDyjUVN3oHlMah0XBd4uTbkfPIhHtw0evPmYOrdhEDoPwvYhzlGplU1AU9mpyiCXH8gpPCBRYjq77VcnbXumNE1yGfyTsbSj89J63kRTKDkKUg3mdS5sJ4X5cQ8dK7oW9IkScssECQdz2O9UTlpRjAFPChjhLdzopQzwxQf8ozdzOhogwAooXpUF83BX4C3jRgjDJiiXEUDMaNz4vQ4n164vspddHvOIVuBBdMA4xp1YhiHk0vOJ8TL1BxogzVlMpmod6ianYGmksQq6NWCEd56hZF4wfaNyZcrGfNxnPiG6ZAxSkfmhJAKtNmCqbRmppeXp8inz4eq3HkWCMSORyMMX522xpHG6basNr6KQfbZsFbHjzyNlJrruLolKFcC84dqfijBO5Dy2NaBcNEBPgQrT12PgpcKx2or2YChN5DPjs80zzdtdAdTKuW4uVv9bbZu3K2SZ2aEhTlIC1UqrIWibkzwHh6p8gLv26zr01mJybfOzFc4T7kQH1IpPwOzMDnAKPLsLrznXGjFNIA9bSWWms6ibKZwQIKrMzalwbFrQJvOP1rPH8rx2KkyYqrtQk5VRwM1HSX。





