好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

HA双机软件解决方案.docx

8页
  • 卖家[上传人]:碎****木
  • 文档编号:241383576
  • 上传时间:2022-01-16
  • 文档格式:DOCX
  • 文档大小:92.15KB
  • / 8 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 双机热备解决方案目录方案分析 31、双机容错基本架构 31) 双机互备援(Dual Active)基本简介 32) 双机热备份(Hot Standby)基本简介 32、双机容错的实现方法 41)ROSE HA 双机软件 +磁盘阵列柜 43.产品介绍: 4双机热备解决方案方案分析1、双机容错基本架构双机容错的目的在于保证数据永不丢失和系统永不停机,采用智能型磁盘阵列柜可保证数据永不 丢失,采用双机容错软件可保证系统永不停机它的基本架构共分两种模式:双机互备援( Dual Active)模式和双机热备份(Hot Standby)模式1) 双机互备援(Dual Active)基本简介所谓双机热备援就是两台主机均为工作机,在正常情况下,两台工作机均为信息系统提供支持, 并互相监视对方的运行情况当一台主机出现异常时,不能支持信息系统正常运营,另一主机则主动 接管(Take Over)异常机的工作,继续主持信息的运营,从而保证信息系统能够不间断的运行,而达到不停机的功能(Non-Stop),但正常运行主机的负载(Loading)会有所增加此时必须尽快将异常机修复以缩短正常机所接管的工作切换回忆备修复的异常机。

      切换时机(Take Over)l 系统软件或应用软件造成服务器宕机l 服务器没有宕机,但系统软件或应用软件工作不正常l SCSI 卡损坏,造成服务器与磁盘阵列无法存取数据l 服务器内硬件损坏,造成服务器宕机l 服务器不正常关机2) 双机热备份(Hot Standby)基本简介所谓双机热备份就是一台主机为工作机(Primary Server),另一台主机为备份机(Standy Server),在系统正常情况下,工作机为信息系统提供支持,备份机监视工作机的运行情况(工作机 也同时监视备份机是否正常,有时备份机因某种原因出现异常,工作机科尽早同志系统管理员解决, 确保下一次切换的可靠性)当工作机出现异常,不能支持信息系统运营时,备份机主动接管(Take Over)工作机的工作,继续支持信息的运营,从而保证信息系统能够不间断的运行(Non-Stop)宕 工作机经过修复正常后,系统管理员通过管理命令或经由以人工或自动的方式将备份机的工作切换回工作机;也可以激活监视程序,监视备份机的运行情况,此时,原来的备份机就成了工作机,而原来 的工作机就成了备份机切换时机(Take Over)l 系统软件或应用软件造成服务器宕机l 服务器没有宕机,但系统软件或应用软件工作不正常l SCSI 卡损坏,造成服务器与磁盘阵列无法存取数据l 服务器内硬件损坏,造成服务器宕机l 服务器不正常关机2、双机容错的实现方法1) ROSE HA 双机软件 +磁盘阵列柜客户端… …LA N… …Lifekeeper for w indow sSC SI 卡应用服务器数据库服务器数据库服务器百兆以太网千兆主干网络SC SI 线缆心跳线磁盘阵列柜优点:1. 数据保存在磁盘阵列柜上,磁盘阵列的稳定性和可靠性高于服务器2. 数据独立于服务器,避免因为服务器的损坏,导致数据不可访问3. 双机切换时间会略短于镜像方式,对于数据实时性要求较高的客户适用4. 可以实现多对一的热备方式,就是多台应用主机对应一台备机的方式5. 可以实现双机互备(ACTIVE/ACTIVE 模式)的方式,既两台服务器都可以运行各自的应用,并且可以成为对方的备机。

      3.产品介绍:第一部分 高可用性系统概述一、计算机系统的故障分类以及故障发生的概率分析u人为操作失误资源不足引起的计生产地点的自然发生u电脑病毒划性停机计算机软硬件故障原因u黑客入侵u失窃业务的快速增长飓风、龙卷风以及原因统和应用程序有时存在缺陷外面的系统破坏者在蓄意攻击地震都可能发生使数据被破坏(如 Y2K 问题)发生经常发生、与企业人员、网络业务增长越快的企可能性最大、最频繁发生概率较小概率设计有关业,发生亦越频繁预防实现硬件冗余,提高业务系统提高人员素质和系统自动化运系统设计考率业务异地保存方法的高可用行管理,加强网络安全防范具体u 磁盘阵列u 数据冷备份本地双机热备份、增u 数据冷备份措施u 本地双机热备份u 安装杀毒软件加硬件资源、软件升u 灾难恢复中心u 网络防火墙级u硬件失效(如硬盘毁坏)人为因素不可避免——失误可火灾、闪电、水灾、产生u软件设计缺陷——操作系以很容易地删除重要数据二、高可用系统解决的问题对现代企业来说,利用计算机系统来提供及时可靠的信息和服务是必不可少 的另一方面,计算机硬件与软件都不可避免地会发生故障,这些故障有可能给 企业带来极大的损失,甚至整个服务的终止、网络的瘫痪。

      对于那些任何停工都将产生严重的财产损失、名誉损失、甚至生命损失的关键性应用的企业或公司,系统的高可用性显得更为重要因此,必须有适当的措施来确保计算机系统提供不间断的服务,以维护系统的可用性信息系统的可用性通常在两种情况下会受到影响,一种是系统当机、错误操作和管理引起的异常失败,另一种是由于系统维护和升级,需要安装新的硬件或软件而正常关机高可靠性软件必须为这两种情况提供不间断的系统服务三、高可用性的定义及与容错技术比较(一) 高可用性与容错技术高可用性 HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性它与被认为是不间断操作的容错技术有所不同HA 系统是目前企业防止核心计算机系统因故障停机的最有效手段容错 FT(Fault Tolerant)技术一般利用冗余硬件交叉检测操作结果当发现异常时,故障部件会被隔离开而不影响用户的操作高可用性方案则利用更少的冗余部件同时由软件检测故障,一旦故障发生立即隔离损坏部件,通过提供故障恢复实现最大化系统和应用的可用性容错技术随着处理器速度的加快和价格的下跌而越来越多地转移到软件中。

      未来容错技术将完全在软件环境下完成,那时它和高可用性技术之间的差别也就随之消失了二) 高可用性系统的功能F 软件故障监测与排除FF备份和数据保护F管理站能够监视各站点的运行情况,能随时或定时报告系统运行状况,故障能及时报告和告警,并有必要的控制手段实现错误隔离以及主、备份服务器间的服务切换(三) 故障恢复建立一个故障恢复系统,每一个重要部件都必须配有冗余备件,当一个部件出现问题时,它会自动被备件替代而不影响系统正常运行,这就是常说的故障恢复高可用性系统的目标是尽量实现不停机操作故障被掩饰掉,而且尽量不修改最终的应用程序四) 服务延续性保持系统的正常运行非常重要,除了人为错误操作和管理引起的异常失败外,正常的软硬件维修时不影响系统运行也很关键开放系统使大量供应商带来了大量不同的软件产品,每一种产品都有自己的升级周期,最简单的系统也要有 2 到 3 个主要部件在不同时候做升级,这就大大降低了系统的可用性因此,也需要为升级和阶段性维护创建相应的容错环境五) 实现高可用高可用性更注重整体资源的可用性而不是某一物理部件的可用性,因此它有系统级和部件级之分为了实现高可用性,服务器、应用程序以及周围环境被整体当作一个系统来看待。

      任何一个有可能影响系统正常运行的故障都会被发现和修复,保证系统尽快地恢复运行第二部分 ROSE HA 高可用性软件美国 ROSE 数据公司(ROSE Datasystem Inc.)是一家专门从事高可用性系统设计及研发的公司,主要产品ROSE HA 是基于 Windows NT/2000、UNIX、LINUX、Solaris、SCO UNIX for IBM 等操作系统平台的高可用性软件,为Client/Server 结构的应用提供高可用性的解决方案ROSE HA 在国内的主要用户有:上海宝山钢铁公司、武汉市工商银行、沈阳电信局、上海埔东电信局、佛山人民银行、湖南邮电局、长沙电信局、上海汇廉商场、外经贸部、广东珠海公安局、邮电部 OA 系统、各地电信 97 工程及新华社等等一、ROSE HA 高可用性软件的工作模式(一) 主从方式工作原理:主机工作,从机处于监控准备状况;当主机宕机时,从机接管主机的一切工作,待主机恢复正常后,按使用者的设定以自动或手动方式将服务切换回主机上运行二) 双工方式二、工作原理:两台主机同时运行各自的服务工作且相互监测情况,当任一台主机宕机时,另一台主机立即接管它的一切工作,保证工作实时。

      ROSE HA 高可用性软件的组成ROSE HA 软件的组成服务程序(Service)为客户提供服务的进程,如 NFS 或 Oracle、Sybase、Informix 等数据库服务HA 代理(Agent)HA 代理监视服务的可用性,并向 HA 管理进程报告服务的状态HA 管理进程(HA Manager)HA 管理进程是 ROSE HA 软件的核心进程,由它来初始化系统配置,接来自HA 代理的信息,并通过私用网与其它服务器的 HA 管理进程通信,协调运行服务器与备份服务器间的关系GUI 管理工具(Administration Tool)系统管理者通过 GUI 管理工具管理、监视服务的运行状态三、ROSE HA 软件的运行过程系统起动后,ROSE HA 首先启动 HA MANAGER 管理程序,根据高可用性系统的配置结构初始化,然后启动必要的服务和代理程序来监控和管理系统服务HA 代理程序用来监控、监测、诊断和管理硬件软件服务代理程序检测到该服务处于活动状态,HA MANAGER 就会认为该服务处于活动状态,HA MANAGER 会定时通知后备服务器上的 HA MANAGER,其每项服务处于正常。

      当代理程序检测到某个服务发生故障时,它就通知 HA MANAGER 管理程序HA 软件首先会重新起动该服务多次(可由用户设定),如果启动不能成功,该服务会由 HA 转移到后备服务器上HA 周期性地检测系统硬件的状态,如果硬件发生故障,HA 会把与该硬件相关的服务转移到后备服务器上当某项服务发生转移时,HA 首先在运行服务器上停止该服务,之后,由备份服务器上的 HA 在备份服务器上启动该服务由于停止和启动该服务都需要一定的时间,所以当服务被切换(转移)时,该服务会有短暂的中断,转移完成后,服务自动恢复正常运行考虑到一些数据库系统(如 Oracle、Sybase、Informix 等)以及其他一些应用软件(如 Domino Server、WWW Server 等),ROSE HA 在 HA 管理模块(HA Manager)的基础上,提供了一系列的 Agen。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.