好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

itil服务管理流程手册.doc

79页
  • 卖家[上传人]:n****
  • 文档编号:56555808
  • 上传时间:2018-10-13
  • 文档格式:DOC
  • 文档大小:2.58MB
  • / 79 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 业务支撑网网管系统规范-服务管理流程分册中国移动业务支撑网网管系统规范服务管理流程分册中国移动通信集团公司2004年4月目 录1 综述 32 运维管理流程详述 42.1 事件管理 42.1.1 事件管理描述 42.1.2 事件管理目的 42.1.3 事件管理范围 52.1.4 相关定义 62.1.5 流程职责/角色 112.1.6 主要内容 122.1.7 流程衡量标准 132.1.8 流程图举例 162.1.9 事件信息项 182.2 问题管理 192.2.1 问题管理描述 192.2.2 问题管理目的 212.2.3 问题管理范围 212.2.4 相关定义 212.2.5 职责/角色 252.2.6 主要内容 252.2.7 流程衡量标准 262.2.8 流程图举例 282.2.9 问题信息项 312.3 变更管理 322.3.1 描述 322.3.2 目的 332.3.3 范围 332.3.4 相关定义 332.3.5 职责/角色 382.3.6 主要内容 392.3.7 流程衡量标准 412.3.8 流程图举例 442.3.9 变更请求信息项 462.4 配置管理 472.4.1 描述 472.4.2 目的 482.4.3 范围 482.4.4 相关定义 492.4.5 职责/角色 522.4.6 主要内容 532.4.7 流程衡量标准 542.4.8 流程图举例 552.4.9 常见配置元素属性表 573 运维管理流程关系和运维支持体系 673.1 运维流程相互关系 673.2 整体运维支持体系 694 附录 714.1 ITIL国际规范简介 714.1.1 ITIL国际规范简介 714.1.2 分阶段实施方法 734.2 名词解释 761 综述本文作为《中国移动业务支撑网网管规范》附件之一,将详细描述本期中国移动业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。

      运维管理流程包括:事件管理、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程示例等在本附件最后,还简单介绍ITIL的相关内容和实施方法2 运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍2.1 事件管理2.1.1 事件管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况事件也包括一个用户的请求,如,重设用户密码不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分类。

      事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件2.1.2 事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持IT环境的稳定性,其目的包括:· 在成本允许的范围内尽快恢复服务v 快速响应系统监控产生的故障或用户的请求v 获得帮助v 沟通问题解决的状态· 进行事件控制v 记录事件v 就事件的优先级、紧急性和严重性进行分类v 分析、诊断,必要时进行升级v 监视,并结束事件· 支持业务运行v 对业务应用提供二级支持v 解答有关如何使用的问题v 记录关于新服务的需求v 记录关于改变的请求· 提供一个与业务部门的日常接口v 提供关于服务状态的信息更新v 新服务的报告v 关于即将到来的新服务或事件的通知v 进行事后回顾· 提供IT管理信息v 人力利用情况v 服务可用性v 产品质量v 支持效率v 供应商服务情况2.1.3 事件管理范围 在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相关的如下事件:v 申告v 故障v 咨询v 业务处理v 维护作业工科事件的产生有两类:v 由监控管理平台自动发现并产生的告警事件v 由用户/IT维护人员报告的事件但不包括:v 外部用户汇报的事件v 在开发和测试环境中的设备或系统产生的事件 “事件管理”流程不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。

      2.1.4 相关定义· 重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件· 事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六类事件:性质描述申告针对BOSS系统的IT用户投诉故障指因BOSS系统错误或非正常因素由监控管理平台发现的告警事件咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要运维人员进行后台数据处理的要求维护作业指运维人员的日常维护作业或临时进行的维护作业其他其他性质的事件· 事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型帮助台的事件来源可以包括以下:来源描述用户来自IT用户的事件可以有以下几种记录方式:l /邮件/---来自用户/IT维护人员报告的事件l 自助开单---用户/支持人员发现问题,直接在服务台系统客户端开单l 客服平台---来自客服平台的事件l 其他---其他方式进入帮助台的事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中 · 事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示:编号优先级1紧急2高3中4低事件的优先级分两个层面来定义和确认:l 帮助台帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。

      如果为紧急事件,立即升级到一线对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别帮助台人员可参考下表确定事件优先级:事件优先级本次事件所对应CI的关键级别123事件性质故障1紧急高中2紧急中低3高低低申告高中低咨询/业务处理/维护作业中低低l 一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:优先级紧急高中低解决时限(小时)48 2448· 事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案可根据所要求的处理时间定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:时间优先级即时响应+15分钟处理时限30%处理时限40%处理时限紧急ABD E F----高ABCDE中ABC --D低AB C ----升级组群:A 帮助台 B 一线支持人员C 二线支持人员D 事件经理E 管理层F 集团公司各省可以根据业务的实际情况调整升级标准。

      · 事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”本规范给出第一级、第二级分类各省市根据自己的情况决定是否要定义到第三层下表为事件分类表举例:类别子类条目基础架构网络通讯系统服务器存储系统系统软件操作系统数据库中间件双机热备软件系统监控软件业务采集计费结算客服业务管理账务管理账务处理一级BOSS拨测其他配套设施空调UPS机柜照明温湿度传感器外设其他· 事件状态代码 事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:事件状态代码描述新建新开事件记录分配事件在帮助台一线处理 一线支持人员已接手处理事件 二线处理二线支持人员已接手处理事件供应商处理由供应商处理已解决 事件已找到解决方案关闭确认解决方案,事件得以关闭· 事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:事件结束代码描述暂时解决用变通办法暂时解决已解决帮助台由帮助台人员成功解决一线解决由一线人员成功解决二线解决由二线人员成功解决第三方解决由第三方成功解决其他包括消失,误操作,可忽略等· 处理是否超时事件超时代码描述未超时事件最后时限范围内结束超时事件未能在最后时限范围内结束2.1.5 流程职责/角色事件管理流程主要分为以下几个职责/角色,分别简述如下:Ø 事件经理· 作为事件流程的负责人,负责制定流程的规则、策略、步骤· 调度资源,协调解决跨小组、部门的事件· 指导日常操作,确保流程的执行符合预定的要求和规则· 建立流程的衡量指标和报表· 与用户、服务商和管理层交流流程的使用情况· 确认和实施对流程的变更/改进计划Ø 帮助台人员· 在指定的响应时间内响应所有帮助台热线、邮件、等事件报告· 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等· 为事件进行适当的分类、为事件分配优先级等属性· 尝试使用工具、初步诊断、分析相关信息等方式解决问题· 如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理· 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展· 与用户确认事件解决方案,关闭事件Ø 一线支持人员一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持。

      · 验证事件的描述和信息,进一步收集相关信息· 决定需要采取何种措施恢复服务并实施有效的行动· 必要时提供现场支持· 根据优先级提供有效的解决方案· 已解决的事件转回帮助台,由帮助台关闭事件· 实施事件解决方案· 更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件· 如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理Ø 二线支持人员二线支持人员是相关问题领域的专家负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等· 进行事件的深入调查研究· 根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动· 必要时引入供应商的支持· 在系统中更新事件根源和最终解决方案· 更新事件记录,确保事件状态代码真实反映事件状态· 及时提供有效解决方案· 与其他小组合作,确定解决方案· 已解决的事件转回帮助台,由帮助台关闭事件· 如果二线不能在解决时限内解决这个事件,应当将事件进行升级2.1.6 主要内容事件管理流程始于事件的探测和报告,结束于事件的解决该流程包含下述主要内容:Ø 事件接收和记录 这个环节是事件管理流程的起点。

      所有用户或系统报告的IT 事件必须由此步骤开始此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员在此步骤中将会收集创建事件记录所需的信息该环节的关键是信息的准确性和完整性Ø 分类和支持事件可以是一个服务请求、信息请求或服务故障,对于每个事件,需要确立优先级、影响度、和分类若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查该环节的关键是需要知识库支持和正确的事件分派Ø 调查和诊断若支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施Ø 解决和恢复技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认Ø 紧急事件和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并同时上报给集团公司,由事件经理决定紧急处理的方式,确保其得到最快速的解决当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与Ø 结束事件当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。

      若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭2.1.7 流程衡量标准事件管理流程的主要衡量指标如下:· 事件记录数量,可按照部门、事件分类等分别统计· 事件关闭的数量,可以按照优先级,或者按照分类分别统计· 事件成功关闭的数量· 规定时间内解决的事件数量/百分比· 帮助台解决率· 事件解决的平均时间,可以按照事件分类统计· 超时的事件数量,可以按人员、组别统计统计报表· 事件记录的数量,可按照事件分类、事件性质、事件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量故障申告咨询业务处理维护作业其他紧急高中高中低中低中低中低紧急高中低网络设备服务器存储系统…计费结算…客服· 处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量新建分配一线处理二线处理供应商处理已解决关闭网络设备服务器存储系统…计费结算…客服· 事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量成功解决可忽略事件后续操作解决部分解决部门1…监控系统1…成功解决可忽略事件后续操作解决部分解决网络设备服务器存储系统…· 按时、超时解决的事件数量/百分比,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决数量帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比部门1…监控系统1…帮助台一线二线第三方按时超时按时超时按时超时按时超时数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比数量百分比网络设备服务器存储系统…· 各角色事件解决率,可按事件来源、事件分类、处理角色等分别按月、周、日汇总统计该时间段内创建的事件记录的解决率帮助台一线二线第三方部门1…监控系统1…帮助台一线二线第三方网络设备服务器存储系统…2.1.8 流程图举例如下是事件管理的逻辑示意图:流程说明序号步骤名称责任人输入说明输出100.1创建事件记录并分类帮助台事件特征描述接受从IT用户或监控管理平台报告的事件,在帮助台系统中产生新服务记录,填入相关信息。

      并对事件进行分类,根据设定标准进行分类和分优先级,设置相关属性事件记录100.2优先级最高?帮助台事件记录根据事件相关的配置元素CI的关键级别确定事件的优先级是否最高,如是立即升级到一线支持人员,否则尝试解决优先级确定结果100.3确认优先级别一线事件记录一线支持人员根据事件相关配置元素和其他相关信息确定该事件是否确属优先级最高已确定优先级的事件记录100.4优先级最高?一线已确定优先级的事件记录如果优先级确实最高,则立即升级到事件经理,并通报集团公司,并立即开始处理,如不是,则返回帮助台N/A通知事件经理事件经理事件记录最高优先级事件必须立即通知事件经理,由事件经理决定是否由原处理人按照原流程执行,还是需要采取必要手段干预(例如:启动危机处理流程、会议等)紧急解决方案上报集团集团事件记录紧急事件必须上报集团公司(并在事件处理过程中的每个状态变化点将最新事件记录上传到集团公司)紧急事件100.5尝试解决帮助台事件记录通过查询知识库,尝试支持解决方案100.6解决了吗?帮助台N/A如果解决了,则进入100.16,确认并关闭事件;如果不能解决,进入100.7,转发至一线N/A100.7事件转发至一线帮助台事件记录选择适当的一线人员,将事件转发转发的事件100.8检查事件并解决一线事件记录检查事件信息,寻求解决方案 解决方案100.9解决了吗?一线N/A如果解决,则将解决方案记入事件记录,并发还帮助台,进入100.16;如果不能解决,则需在事件记录中说明原因,转发二线N/A100.10事件转发至二线一线事件记录选择适当的二线人员,将事件转发转发的事件100.11调查诊断并解决二线事件记录进行进一步调查分析,找出解决方案解决方案100.12解决了吗?二线N/A如果”是”,则将解决方案记入事件记录,发还帮助台,进入100.16;如果”否”,则转入100.13。

      需要供应商支持?N/A100.13需要第三方支持?二线N/A判断是否需要引入第三方(第三方包括厂商和其他部门的支持人员):“是”,转入100.15;“否”,转入100.14N/A100.14超出时限?二线N/A如果超出处理时限,必须及时通知事件经理N/A通知事件经理事件经理N/A事件经理应当特别关注超时的事件,并帮助协调资源,监督事件尽快解决N/A100.15技术支持供应商支持请求供应商得到通知后,应参与事件的解决,并提出解决方案,由二线人员监控供应商的响应速度和处理速度解决方案100.16确认并关闭事件帮助台已解决的事件帮助台应与用户确认是否接受解决方案,如果用户认可,则可关闭事件,如果用户不能接受,则发还处理人员,继续处理关闭的事件记录2.1.9 事件信息项本规范规定事件管理流程必须包含如下事件信息项:信息项说明填写方式事件流水号工单号码系统生成报告人信息本次事件报告人的联络信息,包括:¡ 姓名¡ 省/分公司¡ 部门¡ 电子邮件¡ 办公¡ /BP根据报告人的搜索代码,自动获取CMDB中报告人信息生成时间在帮助台生成事件记录的时间系统生成地点事件发生的地点-发生时间事件发生的实际时间-事件性质从事件所属性质的角度来确定其处理流程,如申告、故障、求助、业务处理、维护作业等。

      事件来源指事件工单产生的途径,有人工产生、系统自动产生两类由监控管理平台自动产生的,可自动填写事件优先级事件优先级决定了事件的解决时限和处理次序,通过综合衡量配置元素的关键级别和其他相关信息得出事件分类从事件从属的系统或技术架构的类型来进行分类,如数据库,服务器等事件标题事件的标题由监控管理平台自动产生的,可自动填写事件描述对于整个事件内容的详细描述由监控管理平台自动产生的,可自动填写事件解决确认人在帮助台得到用户确认的有关人员-事件状态在事件整个生命周期中的不同状态系统生成分配对象被分配的技术支持组和人员-事件日志反映事件处理过程中的事件处理信息,包括人员,时间等信息-是否超时事件处理时间是否超出解决时限系统生成解决时间事件得到解决的时间-解决方案描述事件解决方案的描述-事件结束代码根据事件结束的不同方式赋予不同的结束代码-2.2 问题管理2.2.1 问题管理描述问题是一个或几个已暂时处理但根本原因尚不明确的事件, 许多事件往往是由同一个问题引起的问题的来源主要有以下几种:已经关闭的事件,经过回顾分析后,可能形成一个问题;重大事件,虽然经过紧急处理恢复服务,但未找到根本原因,也形成一个问题;对于趋势性事件的分析,形成问题。

      问题管理流程的根本目的是消除或减少事件的发生, 将BOSS系统内部缺陷导致的业务事件或问题的负面影响降到最低限度,此流程分析发生在生产环境的事件(常常是已关闭的事件记录),确定最常发生或具有最大影响的事件,找出根本原因,然后生成变更请求(RFC)、变通方法或建议的预防性措施来防止事件的再次发生所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题问题通常具有以下特征中的一个或全部:Ø 一组具有一定关系的已结束的事件Ø 一个重大或紧急事件(事件处理结束后定义为问题,由问题管理找出根本解决方案)问题管理与事件管理之间的差异问题管理与事件管理并不相同,它的主要目的是查明事件的潜在原因,并制定随后的解决方案和预防方法在大多情况下,此目的与事件管理目的之间有一定冲突,因为事件管理的目的是尽快地恢复客户服务,通常是通过实施替代方案,而非确定一个永久性的解决方案(例如为了尽可能地预防未来可能出现的事件,寻求改善信息技术基础架构的结构)就问题管理而言,对潜在原因的调查可能需要一定的时间,找到解决方案的速度是次要的考虑因素,但是预防了问题的再次发生问题管理流程可以按照不同领域的问题(如网络问题,或应用问题等)由相关组的技术支持专家来执行,原则上这些专家可以是事件管理的二线支持专家,他们在负责接受来自一线支持人员(帮助台员工)的支持请求的同时,也负责对以往事件进行分析,找出事件产生的根本原因,从而确定解决方案,消除这些根本原因,最终使此类事件不再发生;同时,也要从发生的事件中找出事件的发展趋势或潜在可能发生的问题,从而预先采取措施,保证IT服务的正常化。

      问题的根本原因找出后即成为已知错误, 对已知错误实施解决方案, 从而解决问题所以问题管理流程的输出有:Ø 变更请求Ø 变通方法Ø 根本解决方案Ø 预防性措施Ø 已知错误2.2.2 问题管理目的问题管理流程在 IT部门设立的主要目的是分析已被列为问题的事件(一组或一个)的根本原因,然后找出解决方案包括:Ø 分析并确定事件的根本原因,以防止再次发生Ø 主动提供预防性措施Ø 提高IT服务的可靠性Ø 降低IT支持成本Ø 提高IT部门的整体形象和名誉2.2.3 问题管理范围 问题管理范围是对所有IT生产环境中未根本解决的问题和已知错误进行管理,并采取主动性预防措施来降低事件数量,重大或紧急事件在处理完后也被定义为问题以分析其产生的根本原因一般对IT服务影响最大或最占用支持人员资源的事件优先进行分析 问题管理范围不包括处于开发或测试环境的系统和应用2.2.4 相关定义q 优先级需要确定解决方案的紧急程度,本规范定义如下问题优先级:编号优先级代码解释1紧急关键级别为1的业务中断或将中断,影响一个以上关键地区或半数以上地区2高关键级别为1的业务中断或将中断,影响一个以上地区但未达到紧急标准3中关键级别为1的子业务或半数以上子业务中断或将中断4低未达到以上标准q 问题状态代码问题在整个生命周期中的不同状态。

      本规范定义如下问题状态:编号代码描述1已登记问题登录到系统中2处理中问题正在处理过程中3拒绝问题分派被拒绝4已知错误问题根本原因已找出5已有解决方案解决方案已找到6RFC已提交RFC7结束问题已结束8回顾问题已做回顾q 问题分类 (classification)从问题从属的系统或技术架构的类型来进行分类本规范定义如下问题分类:类别子类条目基础架构网络通讯系统服务器存储系统系统软件操作系统数据库中间件双机热备软件系统监控软件业务采集计费结算客服业务管理账务管理账务处理一级BOSS拨测其他配套设施空调UPS机柜照明温湿度传感器外设其他q 问题性质根据问题的不同来源进行分类本规范定义如下问题性质:编号代码备注1升级事件从事件管理中升级的事件2系统构架问题技术专家提出的问题3主动防范性分析事件记录找出的问题q 问题结束代码问题结束代码: 根据事件结束的不同方式赋予不同的结束代码本规范定义如下问题结束代码:编号代码说明1根本解决找出问题的根本原因,并得到解决方案,成功解决2变通方法未找出根本原因,但有临时解决方案作为变通方法3没有解决问题无法解决4消失 问题无法再现2.2.5 职责/角色问题管理流程主要分为如下几个职责角色,分别简述如下:问题经理· 整体上对流程负责,确保流程的有效执行· 定期评估流程,制定流程改进计划· 确定或定义问题,并确保有效协调资源· 监视问题的诊断,分析和处理过程· 提出实施解决方案的变更请求· 定期制定IT问题报表,提供正确决策信息问题分析专家· 接受问题经理分派过来的问题· 分析和诊断问题,确定根本原因· 确定和测试解决方案· 协助事件支持人员进行重大或紧急事件的处理2.2.6 主要内容问题管理流程着重于消除事件或减少事件发生,确定事件的根本原因。

      主要活动包括分析事件、找出问题、分派问题、确定根本原因、找出解决方案以消除事件或在其发生时降低对用户或业务的影响其主要内容如下:1. 分析事件 定期分析事件,找出潜在问题2. 生成问题记录 · 在系统中生成问题记录并把所有相关事件与此记录关联起来· 重大或紧急事件处理完后定义为问题· 技术支持专家在日常运维中发现的问题· 主动性防范3. 分派 根据问题内容将问题记录分派给适当的技术小组4. 根本原因分析 被分派的小组人员将调查问题以期找出其原因,制定解决方案、变通方法或提出预防性措施,以消除产生原因,或在重发时使其影响力最小化5. 更新已知错误 问题记录必须被更新以反映它是已知错误状态,并且把任何变通方法、避免或最小化负面影响的动作行为也记录下来(如果需要添加到知识库中)6. 提出变更请求 对问题的解决方案进行评估,通过提出变更请求(RFC)以对该方案进行测试和实施如果RFC没有被批准,问题记录保持为已知错误,它们可以被事件支持人员在事件再次发生时参考借鉴7. 关闭 一旦找出问题根本原因,并实施了解决方案,确认已解决了问题,问题记录可以关闭8. 事后回顾 问题必须进行回顾以找出改进机会或总结预防性措施。

      包括改进事件监测、找出技能差距和文档资料改进等2.2.7 流程衡量标准问题管理流程的主要衡量指标如下:• 每一阶段内的已知错误数量• 在每一阶段内未结的问题记录• 每一阶段内未了结的由问题引发的RFC数量• 在IT环境中存在的临时性变通办法数量统计报表问题的数量,可按问题分类、问题性质、优先级、影响度等分别按月、周、日汇总统计该时间段内创建的问题记录数量优先级影响程度紧急高中低高中低无网络设备服务器存储系统…优先级影响程度紧急高中低高中低无升级事件系统构架问题主动防范性处于各状态的问题数量,可按问题分类、问题性质、问题状态分类实时汇总已登记处理中拒绝已知错误已有解决方案RFC结束回顾网络设备服务器存储系统…已登记处理中拒绝已知错误已有解决方案RFC结束回顾升级事件系统构架问题主动防范性• 问题关闭的数量,可按问题分类、问题事件、问题结束代码等分别按月、周、日汇总统计该时间段内创建的问题记录的关闭数量根本解决变通方法没有解决消失网络设备服务器存储系统…根本解决变通方法没有解决消失升级事件系统构架问题主动防范性2.2.8 流程图举例如下是问题管理的逻辑示意图举例:关于该逻辑流程的简单描述如下:序号步骤名称责任人输入说明输出300.1分析事件问题经理事件记录定期分析回顾事件,主动发现潜在问题。

      分析事件的频度和严重度,和其他的相关因素进行关联,如CI位置、宕机时间、特定用户、硬件平台、软件版本和一天中发生的时间等具体的做法可以是一周开一次由主要事件支持人员参加的例会,讨论上周发生的IT事件分析结果300.2创建问题记录问题经理分析结果把找出的问题记录到系统中去,并进行详细说明问题记录300.3问题优先级及分类问题经理问题记录根据问题的实际情况,给其分派一个优先级代码和影响度代码(必要时进行升级,如优先级最高时),并根据拟定的分类原则给问题赋予适当的类别代码并根据问题具体情况设定一个解决时限已分类问题优先级最高吗?问题经理已分类问题如果问题优先级为最高,由问题经理立即把该问题上报到集团公司,并把该问题升级到管理层N/A300.4分派给工作组/监视问题经理问题记录初步判断问题的可能原因,把问题分派给相应工作组或个人,并监视问题的解决过程,如有必要(如超过解决时限)启动升级流程已分派问题在必要时升级问题经理N/A问题经理在监视问题解决的过程中,根据具体情况可把该问题升级到管理层,如问题超出解决时限时N/A判断是否接受?问题分析专家N/A问题分析专家对问题进行初步分析,以决定接受与否。

      如拒绝转向3006继续,如接受转向300N/A300.5拒绝问题问题分析专家已分派问题问题分析专家根据判断发现问题应该由其他组分析解决,就把问题发回问题经理,注明拒绝理由并推荐组名转向300已拒绝问题300.6分析根本原因问题分析专家已接受问题如果问题确应由本人或本小组解决,接受分派的问题,然后调查诊断问题,如有必要成立问题分析小组,举行问题根本原因分析研讨会议并确定问题的潜在原因必要时更新问题状态问题根本原因300.7推荐解决方案/变通方法问题分析专家问题记录、问题根本原因找出问题的根本原因后,根据实际情况制定变通方法或根本性解决方案,并确保这些方法或方案将降低或消除事件的发生率或影响度,更新问题记录问题解决方案问题变通方法300.8安排实施解决方案问题经理问题解决方案问题变通方法根据问题专家提供的解决方案或变通方法, 计划并实施解决方案以解决问题解决方案实施计划判断是否需要变更?问题经理N/A判断实施上述解决方案是否需要进行变更,如不需要变更转向30010继续,如需要变更转向3009以提出变更请求N/A300.9提交变更请求问题经理解决方案实施计划根据问题分析专家制定的解决方案或变通办法,提出变更请求,填写变更请求单,递交到变更管理流程,并监视变更的实施过程,和变更管理保持沟通。

      变更请求RFC300.10 关闭问题记录问题经理已解决的问题变更结束后,确认问题已经解决,选择相应的结束代码,更新问题状态,关闭问题记录已关闭的问题300.11回顾问题经理已关闭的问题对所有已关闭问题都进行回顾,找出可能改进的机会,包括问题的解决方案和管理流程方面,如改进升级规则、改进事件监测、找出技能差距和文档资料改进等;回顾之后更新问题状态已回顾的问题2.2.9 问题信息项本规范规定问题管理流程必须包含如下问题信息项:信息项说明问题流水号系统自动生成的工单号码生成时间生成问题记录的时间地点问题发生的地点问题性质指问题的来源问题优先级问题优先级决定找到解决方案的紧急程度影响程度问题对IT环境的影响程度问题分类从问题从属的系统或技术架构的类型来进行分类,如数据库,服务器等问题标题问题的标题问题描述对于整个问题内容的详细描述问题状态在问题整个生命周期中的不同状态问题日志反映问题处理过程中的问题处理信息,包括人员,时间等信息解决时间问题得到解决的时间解决方案描述问题解决方案的描述问题结束代码根据问题结束的不同方式赋予不同的结束代码2.3 变更管理2.3.1 描述变更管理通过一个单一的职能流程来控制和管理整个IT运行环境中的一切变更,并和配置管理建立接口。

      变更管理应该由管理工具来支持,管理的范围可包括软件,硬件,网络设备和文档等的变更变更请求通常由于问题的解决方案中需要对生产环境进行某些改变而产生需成立一个变更顾问委员会(Change Advisory Board,以下简称CAB)来帮助和支持变更经理,根据变更内容来决定CAB的成员,可以包括客户代表、运维支持人员、应用开发和供应商等跟变更有关的人员 CAB通过开会讨论等手段来评估变更请求(RFC)的:q 潜在风险和影响q 实施变更需要的资源q 是否批准变更q 如果批准,什么时间实施CAB也负责变更实施后的回顾以考察:q 变更是否成功?是否产生其他副作用?q 实际所用的资源和预期的是否一致?批准后,变更将进入计划,测试/构建和实施阶段计划/构建阶段也包括开发一个回退计划(Fallback Plan),用以在实施阶段出现问题或紧急状况时需要把变更回退回去变更管理流程也负责紧急变更,在此种情况下,变更的评估、计划、测试和实施阶段都将快速进行2.3.2 目的变更管理流程将通过标准统一的方法和步骤来管理和控制所有对IT生产环境有影响的变更主要的目的包括: · IT部门可以管理和引导用户变更需求· 通过对所有变更的正确评估,可以维护IT生产环境的完整性· 变更和变更实施得到正确记录,并提供审核统计· 减少或消除由于变更实施准备不当等原因出现的对IT环境的破坏作用· 提高资源使用率2.3.3 范围 变更管理流程涵盖生产环境的所有变更。

      一般不包括:· 尚处于开发和测试阶段的系统和应用的变更· 不需要IT部门介入的、由用户控制的行为动作2.3.4 相关定义q 优先级 优先级用来说明变更需要得到实施的紧急程度:序号优先级说明1紧急要求变更在提出申请后二天内完成2正常除了常规和紧急之外的变更3常规预先定义的日常类变更q 风险等级除了常规变更,还需通过下表所列的衡量因素来评估实施变更可能带来的风险衡量因素条件得分地市/区域IT用户数量(受到实施或取消的影响)影响一个以上关键地区或半数以上地区1影响一个以上地区但未达到半数,并没有关键地区受影响2影响一个地区的全部用户3影响一个地区的部分用户4准备/实施必需的资源3个或更多支持小组12个支持小组2超过1人,相同的支持小组31人4变更成功的可能性无法测试,变更失败可能性很高1能实现部分测试,变更失败可能性较高2有成熟的变更方案,变更失败可能低3无需测试,变更失败可能性没有4变更规划时间6天或更长12-6 天21-2天3小于1天4变更实施时间超过2小时或/服务断供期11-2小时 2不到1小时3不到30分钟 4回退时间回退时间超过2小时1回退难度中等以上(1-2小时)2回退难度适中(1小时或更短)3易于回退(30分钟或更短)4注:紧急变更的实际规划时间很短,但评估时应按照该变更正常处理情况下所需的规划时间来评估。

      根据上表,对每个变更进行评估,最终得分为各分项得分的总和,再根据总分确定对应的风险等级和实施完成后的观察期:总得分风险等级实施完后的观察周期6 – 9重大6-7天10 – 13较大4-5天14 – 17中等2-3天18 +较小小于等于1天以上风险等级由变更主管进行初步评定,再由CAB进行最终确定q 状态变更请求从提出、实施到结束的整个生命周期中的不同状态:序号状态说明1已登记变更请求已登入系统2已评估变更请求已得到CAB评估3已授权变更请求已得到CAB授权4   已计划变更实施计划已由变更经理收集并确定可执行5进行中变更实施过程中6已结束变更已结束7观察中变更实施结束后处于观察状态7已回顾变更已得到回顾8关闭变更请求已关闭q 结束代码 根据结束变更的不同方式赋予不同代码:序号代码说明1完全成功完全达到变更目的2部分成功部分达到变更目的3取消变更实施过程中被取消4拒绝变更请求被CAB拒绝q 类别(Category) 根据中国移动目前的变更种类,变更的分类层次设计不超过三层第一级分类,称之为”类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”本规范给出第一级、第二级分类,各省市根据自己的情况决定是否要定义到第三层。

      下表为变更分类表举例:类别子类条目基础架构网络通讯系统服务器存储系统系统软件操作系统数据库中间件双机热备软件系统监控软件业务采集计费结算客服业务管理账务管理账务处理一级BOSS拨测其他配套设施空调UPS机柜照明温湿度传感器外设其他2.3.5 职责/角色变更管理流程主要分为如下几个职责角色,分别简述如下:变更请求者· 发现或获取变更需求· 确定并分析变更需求和内容· 填写变更请求单并提交给相关相应变更主管变更经理· 整体上对流程负责,确保流程的有效执行· 确保变更请求得到有效评估,授权和实施确保只有授权和必要的变更才被实行,并使该种变更影响最小化 · 定期召开变更会议,回顾/制定下阶段变更规划· 定期评估流程,制定流程改进计划· 定期制定变更管理报表,提供正确决策信息变更顾问委员会CAB· 针对具体变更请求,评估并分派相应资源· 回顾所有提交的RFC,并确保它们的潜在影响和风险得到评估· 回顾所有已执行的变更,确保满足变更目的· 参加CAB会议和紧急CAB会议· 协助变更经理确定变更优先级及变更规划· 一般根据不同变更内容有不同人员组成变更主管· 由与变更请求内容相关的具体技术领域的负责人(如组长)担任· 检查由变更申请人提交的变更请求RFC,并完善或调整RFC信息,必要时拒绝无关或无法实施或没有必要的变更请求· 作为具体变更的项目经理,负责领导变更的构建/测试,实施和参与回顾· 制定变更项目计划和时间规划等· 确保变更在预定的时间,资源和成本内完成· 在必要时,确保回退计划(Fallback Plan)得以正确实施变更实施人员· 根据变更主管制定的变更实施计划· 执行分派的任务以推进变更项目· 向变更主管汇报工作进程· 现场负责变更实施2.3.6 主要内容变更管理流程通常将包括如下内容:q 提出RFC变更申请人提出RFC,由变更主管负责检查和完善其内容,并进行风险等级、优先级的初步评估。

      q 接受RFC变更经理接受RFCq 变更请求分类和升级通过分类,确定是否为重大变更、紧急变更,如果是常规变更请求,则由相应变更主管安排实施;如果风险等级为”重大”的变更请求,应上报省公司管理层和集团公司;紧急变更适用同一流程但将得到快速批准和实施q 变更顾问委员会(CAB)评估变更经理将根据特定的变更请求成立特定的CAB,成员包括对该变更的评估和批准提供应有附加价值的技术人员和管理人员.评估工作包括技术可行性,对容量的影响,对现有服务的影响,资源需求等.q 批准 RFC变更经理确定对该RFC有批准权的人员参加CAB,必要时参与评估.评估后CAB根据判断决定是否批准RFCq 建立变更实施计划/测试结果,并批准实施变更请求得到评估和批准后,变更主管安排相应资源进行变更的构建/开发、测试,并制定实施计划随后提交计划和测试结果给变更经理以获得批准 q 规划RFC实施计划一旦获得批准,变更主管必须根据资源和其他情况进行规划,确定实施时间表,分配相应资源,并通知请求人 q 协调变更实施一切就绪后,可以实施变更.相应小组实施变更,变更主管监视实施过程,并在必要时进行协调. q 更新变更状态在整个变更过程中,变更的状态从登记,评估,回顾到最后关闭是不同的.变更经理负责更新预先定义好的变更状态. q 回顾和关闭 实施变更后,CAB负责从技术和流程角度去回顾变更,确保RFC得到了预期效果,并寻找流程的改进机会。

      随后,变更经理负责关闭RFCq 总结汇报向管理层提供流程报表,提供变更的用价值的信息,定期向相关小组/部门根据流程衡量标准汇报q 变更会议变更经理负责定期或不定期召开变更会议,与IT内部成员和用户沟通,传递将要实施的变更等信息,以及对变更流程的反馈和建议等q 变更流程回顾建议定期回顾变更管理流程以提高效率和效能,在实施变更流程不久之后,可以进行第一次回顾,以确保流程得到正确实施并起到预期目的对发现的问题必须追根溯源并尽快解决.之后,可以定期举行正式的回顾,如每六个月回顾一次 2.3.7 流程衡量标准变更管理流程的主要衡量指标如下:• 每一类型的变更数量 • 执行回退计划(Fallback plan)的变更数量• 变更实施的成功率• 紧急变更所占的比率• 被拒绝的RFC的数量或比例• 每一类优先级的变更数量统计报表RFC数量,按优先级、风险等级、变更类别、申请人部门/归属小组等分别按月、周、日汇总统计该时间段内创建的RFC数量风险等级重大风险等级高风险等级中风险等级低紧急正常常规优先级风险等级紧急正常常规重大高中低网络设备服务器存储系统…优先级风险等级紧急正常常规重大高中低部门1…小组1…处于各状态的RFC数量,可按优先级、风险等级、变更类别、申请人部门/归属小组、状态实时汇总优先级风险等级紧急正常常规重大高中低已登记已评估已授权已计划进行中已结束观察中已回顾关闭已登记已评估已授权已计划进行中已结束观察中已回顾关闭网络设备服务器存储系统…已登记已评估已授权已计划进行中已结束观察中已回顾关闭部门1…小组1…RFC关闭的数量,可按优先级、风险等级、变更类别、关闭代码等分别按月、周、日汇总统计该时间段内创建的RFC的关闭数量优先级风险等级紧急正常常规重大高中低完全成功部分成功取消拒绝完全成功部分成功取消拒绝网络设备服务器存储系统…完全成功部分成功取消拒绝部门1…小组1…2.3.8 流程图举例如下是变更管理的逻辑示意图举例:关于该逻辑流程的简单描述如下:序号步骤名称责任人输入说明输出400。

      1 提交变更请求变更请求者变更需求及相关信息请求者发现或接到变更请求,跟相关部门或用户确认,然后填写变更请求并提交给相关变更主管初始RFC4002检查/完善变更请求变更主管初始RFC相关变更主管负责对变更请求者提交的RFC进行检查,确定变更优先级和风险等级,如有必要则对RFC相关信息完善或更正,以保证RFC的正确性和完整性经过完善的RFC,包含所有必需的正确信息4003接受变更请求变更经理经过完善的RFC接受变更请求,检查变更请求的完整性和正确性,确定相关变更顾问委员会CAB成员 RFC登录进变更管理系统常规变更?变更经理判断所提交的变更是否为常规变更, 如果是,直接由变更主管负责该变更的计划和执行;如不是常规类变更,则继续重大变更?变更经理风险等级为”重大”的变更请求,变更经理应立即上报至集团和省公司管理层紧急变更?变更经理判断是否为紧急变更,如是,则转向紧急变更流程,否则继续4004协调CAB相关活动变更主管确定的CAB名单相关变更主管与已确定的CAB成员进行沟通,确保RFC具体内容得到共识,并准备CAB会议CAB成员都已明确RFC内容4005评估风险/影响变更顾问委员会CAB待评估的RFC召开会议或指定人员对变更请求进行评估并得出结论RFC得到评估,包括变更风险,优先级,影响度等授权吗?变更顾问委员会CAB决定是否对该变更请求授权,如果授权,则继续,否则拒绝变更请求并由变更经理与变更请求者进行沟通400。

      6 制定测试/实施计划变更主管得到授权的RFC变更主管负责测试和制定实施计划,并把测试结果和实施计划递交给变更经理以批准实施 变更的测试计划和实施计划批准吗?变更经理决定是否批准实施变更,必要时召集变更顾问委员会,如批准,则继续,否则把测试结果和实施计划 退还给变更主管并要求重新提交4007总体变更计划变更经理变更的测试计划和实施计划综合其他RFC,来制定或修改总体变更计划总体变更计划需要集团公司审批吗?变更经理N/A对于重大变更,还需判断是否属于需要集团公司审批的变更,如是,则上报集团公司,等待批准,如批准,则转4008,制定具体计划,如不批准,则转4006,重新制定测试和实施计划;如不需要集团公司审批的变更,则直接转4008进行制定具体计划N/A4008制定具体计划和协调沟通变更主管· 变更测试计划和实施计划· 总体变更计划综合总体变更计划、变更测试和实施计划,确定一个最合适的实施时间,根据需要与相关部门进行充分沟通具体实施计划4009实施变更实施人员具体实施计划根据具体实施计划执行变更实施,在必要时启动回退计划(Fallback Plan);并在实施完成后得到配置经理授权更新相关配置信息· 已实施的变更· 已更新的配置信息400。

      10回顾变更顾问委员会CAB已实施的变更变更经理召开CAB会议对实施的变更进行回顾以确定变更目的是否已达到已回顾的变更40011结束变更经理已回顾的变更更新相关信息,关闭变更记录变更请求关闭2.3.9 变更请求信息项本规范定义如下变更请求信息项:信息项说明变更请求序列号为每个变更请求分配一个唯一的序列号记录创建时间变更请求创建的时间发起人信息记录变更请求者的基本信息,包括:¡ 姓名¡ 省/分公司¡ 部门¡ 电子邮件¡ 办公¡ /BP优先级□紧急 □正常 □常规风险等级□重大 □高 □中 □低所影响的应用系统实施该变更将对哪些应用产生影响变更类别变更的分类变更描述简单描述变更请求变更详细内容详细描述变更的内容变更完成时限变更要求完成的时限变更状态RFC所处的状态变更主管填入变更主管姓名,变更请求应当先由变更主管检查变更主管提交时间变更主管提交变更请求的时间变更审批记录记录变更审批的历史记录,包括:¡ 审批人姓名¡ 审批结果¡ 原因¡ 时间变更计划包括变更的实施计划、测试计划、回退计划等,以及变更任务分配给哪些实施者变更日程安排变更实施的时间安排变更实施情况由变更实施人填写,用于描述实施时的现场情况变更测试情况描述测试的情况、测试结果变更观察情况描述变更结束后,观察期间的情况变更关闭状态□完全成功 □部分成功 □取消 □拒绝关闭时间变更关闭的时间关闭人关闭人的姓名2.4 配置管理2.4.1 描述配置管理是一个描述、跟踪和汇报所有IT基础架构中的每一个设备或系统的管理流程。

      这些设备和系统被称为配置元素(CI) 每一个CI必须被有效管理、跟踪和控制以支持IT服务和基础设施成功运行配置管理流程所管理的配置元素包括硬件、软件和网络设备、文档等IT基础架构中所有必须控制的组成部份所有的数据存在配置管理数据库(CMDB) 中在说明一个配置元素(CI) 时,CI被赋予一个名字和描述,同时诸如责任人、状态、配置等相关属性也被详细记录CI之间的关系也可找出并记录到CMDB中CI改变时,CMDB中的相关信息被更新,对CMDB也进行定期审核以确认和维护数据的完整性和一致性配置管理是IT基础架构组成部份的文档化描述(如状态,关系等) ,并包括配置元素(CI) 相关的文档资料它制定、跟踪和汇报相关信息,以增强其他流程的更有效运行,特别是变更管理、事件管理和问题管理等流程配置管理是IT服务管理的一个核心流程,能确保IT环境中所有IT设备/系统及其配置信息得到有效完整的记录和维护,包括各IT设备/系统之间的物理和逻辑关系,从而为实现有效IT服务管理奠定基础例如: 通过了解系统当前的配置信息,与其他配置元素的关系和历史状况等,帮助台员工可迅速正确判断故障,找出有效解决方案,从而确保系统的可用性。

      2.4.2 目的配置管理流程的总体目标是提供一个统一的一致的流程来管理IT生产环境中的所有组成部份,以确保:· 所有配置元素(CI) 被识别和记录下来· 配置元素当前和历史状态得到汇报· 配置元素记录的完整性得到维护和确认· BOSS系统生产环境的稳定性2.4.3 范围 配置管理的范围是IT生产环境的所有配置元素(CI) ,包括生产环境的硬件、软件、网络设备、以及测试开发环境的硬文档等,具体内容包括识别、控制、汇报和审核等行为 不包括:· 处于开发或测试环境的设备或系统2.4.4 相关定义q 配置元素关键级别为了区别事件相关联的配置元素对移动业务的影响,对于BOSS系统主要配置元素(CI)进行关键等级定义:等级描述说明1高2中3低 所有配置元素的关键级别由其相关联的业务或子业务的关键级别决定,业务和子业务作为配置元素在配置管理数据库中管理 本规范规定业务/子业务关键级别定义如下:业务业务关键级别子业务子业务关键级别采集1采集源1采集点1数据传输1计费1服务使用记录接受点1预处理点1高额处理1分拣1批价1入库1输出点1结算1漫游结算数据上传1漫游结算数据接收1漫游结算数据处理1漫游结算稽核2漫游结算单生成2网间结算关口局数据收集3网间结算数据处理3网间结算稽核3网间结算单生成3帐务处理1帐务数据采集1出帐预处理1加载外部数据1出帐计算1出帐核查1出帐调整1出帐确认1定期出帐1实时出帐1定额出帐3帐务管理1销帐1反销帐1欠费催缴1欠费服务限制1无主帐单检查2帐务对帐3帐务调帐2帐务减免2呆坏帐处理2挂帐处理3营业1业务受理开户1预约服务3业务受理预销户3业务受理销户2更改用户资料3服务变更1付费计划变更2套餐计划变更2营业缴费1托收2缴费卡缴费1银行划帐1冲正1客户服务查询2帐务情况查询2详单查询2停/复机管理1银行接口管理1SMP接口管理2拨测3计费准确性3拨测系统运行状况3业务受理销户3客服1性能统计3信令相关的性能统计1电路群性能统计1语音服务1CTI服务器1IVR1自动台话务2人工台话务1话务员信息3客户查询1业务受理1客户投诉与建议1预约服务3信息发布3一级BOSS1异地客户资料查询1异地停/复机1异地换卡/补卡1异地缴费1交费冲正117201业务鉴权2WLAN业务鉴权2n 主机、存储、数据库、中间件的关键级别按其所承载的业务的最高关键级别确定n 网络、备份等设备原则上不作为高关键级别的资源,其关键级别由各省自定q 配置元素状态配置元素在整个生命周期中的不同状态,本规范规定如下配置元素状态代码:代码状态1已订购2已开发3已入库4已安装5测试中6生产中7维护中8已报废9已丢失10已退役11非管辖2.4.5 职责/角色配置管理流程主要分为如下几个职责角色,分别简述如下:配置经理· 整体上对流程负责,确保流程的有效执行· 定期评估流程,制定流程改进计划· 制定配置管理政策· 定期制定配置管理报表,提供正确决策信息配置管理员· 记录和维护CMDB中的所有CI及相关信息· 根据配置经理要求产生相关报表· 保证对所负责的CI的数据正确性· 对所负责的CI进行添加,修改等2.4.6 主要内容配置管理流程着重于管理IT生产环境中所有必须控制的组成元素,并为其他相关流程(如事件管理等)提供相关信息,以使这些流程得到更有效的运行,从而保证IT环境的完整性和稳定性。

      其主要流程内容如下:1. 识别和维护CIs确定需要进行配置管理的IT元素, 及所有必需的配置属性,并指明与IT环境中其他配置元素之间的关系对配置管理数据库提供日常维护2. 配置控制加强对CI变更的相应授权,在CI的整个生命周期内跟踪CI的状态(如以前、当前、计划状态等) , 确保只有被认可的和被标识的配置项及其配置信息才能输入CMDB或更新CMDB3. 汇报和状态汇总根据需要,定期产生配置管理报表,并能使相关人员进行选择、抓取、分类和返回所查询的CMBD数据 定期产生配置项的状态报告,并能反映配置项的版本和变动历史4. 审计和确认定期审核全部或部分CMDB数据,确认和物理环境的一致性,从而确保配置信息的完整性该工作可定期和不定期进行:· 不定期(可每周或根据需要)从监控平台传送配置数据到服务管理平台的进行比对· 定期(如每季度)对全部或部分配置元素进行审计 如发现物理信息和逻辑信息的不一致性,需提交变更请求RFC,通过变更管理流程进行调整5. 流程管理配置流程管理主要包括计划、回顾和改进等配置经理定期制定计划(如半年),以明确下阶段配置管理工作配置经理定期回顾流程和审核结果,找出改进机会,包括针对流程和CMDB的改进2.4.7 流程衡量标准配置管理流程的主要衡量指标如下:· 所审计的CI符合CMDB版本/信息的比例· 由CMDB控制的CI的比例 · 检测到未被批准/授权的IT元素正在使用中统计报表由CMDB控制的CI的数量,可按CI的状态、类别汇总统计主机网络链路中间件数据库存储设备业务合同人员介质/文档已订购已开发已入库已安装测试中生产中维护中已报废已丢失已退役非管辖所审计的CI不符CMDB信息的数量,可按CI的类别汇总统计主机网络链路中间件数据库存储设备业务合同人员介质/文档审计不符数量占该类总数百分比监控平台检测到的不符CMDB信息的CI数量,可按CI的类别按月、周、日分别汇总统计该时间段内所监测到的信息不符的CI数量主机网络链路中间件数据库存储设备业务合同人员介质/文档审计不符数量占该类总数百分比2.4.8 流程图举例如下是配置管理的逻辑示意图举例:关于该逻辑流程的简单描述如下:序号步骤名称责任人输入说明输出200。

      1 识别,定义配置管理员待入库的IT元素对所要管理的IT环境的所有组成元素进行命名和说明,包括对CI之间关系的描述;在添加一个新的授权记录时,确保所有需要的信息度符合配置管理的要求和标准确定所有必要信息的配置元素2002更新CMDB配置管理员配置信息的增删请求根据需要更新配置管理数据库,如增加或删除配置信息已更新的CMDB2003报表和状态汇总配置管理员报表或信息需求根据需要定期产生报表和状态汇总报告,向其他流程和相关人员提供配置信息配置信息报表或状态报告2004审计/确认配置管理员审计需求通过审核确认CMDB中CI信息和其物理信息的一致性,并通过变更管理流程消除不一致信息 ,具体可通过对所管理的配置元素的定期审计和随机抽查审计结果变更请求2005流程计划制定配置经理· 计划周期开始· 流程改进建议· 审计结果定期制定配置管理活动计划,包括人员,技术和流程等方面的内容可以每半年进行一次已制定或改进的流程计划2006流程计划实施配置经理已制定的流程计划实施流程计划已实施流程计划2007流程回顾/改进建议配置经理回顾周期开始审计确认结束或回顾后发现流程效率不高,其他流程或组织需要新的方法等情况时,都需要对当前流程进行改进或制定新的流程。

      · 已回顾流程· 改进建议2.4.9 常见配置元素属性表以下对常见CIBOSS网管中需要维护的CI,以及的CI的常见属性进行汇总罗列:q 主机主机基本属性属性说明主机名主机的标示关键级别主机的关键级别主机地址主机的IP地址(服务IP)主机厂商主机的厂商主机型号主机的型号序列号主机序列号逻辑名主机的逻辑名搜索代码主机的唯一ID逻辑卷路径各逻辑卷的路径名逻辑卷大小各逻辑卷的大小(MB)状态主机的状态用途主机的用途CPU个数主机的CPU数目CPU型号主机CPU的属性CPU主频主机CPU的主频率内存大小主机的内存大小内置硬盘大小主机内置操作系统版本主机操作的版本资产号主机的资产号系统网络接口数系统中网络接口的数量系统网络接口IP地址系统各网络接口的IP地址系统网络接口物理地址系统各网络接口的物理地址系统交换区大小总的SWAP区大小(MB)文件系统名称文件系统的标示文件系统的总空间主机文件系统总的可用量TPCC主机的TPCC值备注主机相关配置元素相关联配置元素说明业务主机上承载的业务或子业务数据库主机上安装的数据库中间件主机上安装的中间件存储设备与主机相连的存储设备网络设备与主机相连的网络设备管理员主机的管理员维护合同主机的维护合同购置合同主机的购置合同q 网络网络基本属性属性说明设备名称网络设备的标示关键级别网络设备的关键级别设备型号网络设备的型号搜索代码网络设备的唯一ID状态网络设备的状态管理人员网络设备的管理员序列号网络设备的序列号网元类型网络设备的类型网元厂商网络设备供应商设备软件版本网元设备当前安装的软件版本号网元名网元配置名称,或由名字解析、DNS服务解释的名称网元IP地址网元管理端口IP地址端口标识网元设备的每个端口的唯一标识名或ID号端口类型网络设备配置的端口模块类型端口设置速率网络设备各端口的最大速率(kbps)端口物理地址网络设备端口固化的物理地址端口IP地址网络设备端口配置的IP地址以及其掩码端口数量网络设备配置各种类型端口的数目资产号网络设备的资产号用途网络设备的用途备注网络相关配置元素相关联配置元素说明网络设备相关联的网络设备主机相关联的主机服务合同网络设备的维护合同购置合同网络设备的购置合同管理员网络设备的管理员q 链路(广域网) 链路基本属性属性说明链路名称链路的标识搜索代码链路的唯一代码关键级别链路的关键级别状态链路的状态类型链路的类型带宽链路的带宽运营商链路所属的运营商资费链路的资费序列号链路的序列号用途链路的用途备注链路相关配置元素相关联配置元素说明管理员链路的管理员网络设备相关联的网络设备服务合同链路的维护合同购置合同链路的购置合同q 中间件中间件基本属性属性说明软件名称中间件软件名称版本中间件产品版本关键级别中间件的关键级别序列号产品序列号搜索代码中间件的唯一ID厂商中间件产品的厂商用途中间件的用途状态中间件的状态中间件类别¡ 交易中间件¡ 传输中间件¡ 应用服务器中间件端口号中间件的端口号最大并发连接数与数据库连接数最大并发网络客户端数量与客户端连接数系统日志路径中间件的系统日志路径用户日志路径中间件的用户日志路径配置的队列空间大小传输中间件使用,中间件配置的所有队列所占字节数配置的队列所在路径传输中间件使用,在队列模式为磁盘队列时有效单条队列所允许的消息总个数传输中间件使用,单条队列所允许的消息总个数单条队列所占字节数传输中间件使用,单条队列所占字节数队列模式传输中间件使用,指队列属性是内存队列还是磁盘队列应用服务器运行模式应用服务器群集还是单机允许应用服务器支配的内存堆大小(MB)应用服务器使用,允许应用服务器支配的内存堆大小(MB)配置的总线程数应用服务器使用,配置的总线程数配置的数据库连接池大小应用服务器使用,配置的数据库连接池大小中间件相关配置元素相关联配置元素说明主机运行中间件的主机业务中间件关联的业务或子业务数据库与中间件相关联的数据库管理员中间件的管理员服务合同中间件的维护合同购置合同中间件的购置合同q 存储设备存储设备基本属性属性说明设备名存储设备名称设备型号设备规格型号关键级别存储设备的关键级别搜索代码存储设备的唯一ID序列号产品序列号厂商存储设备厂商状态配置项状态用途存储设备的用途位置安放地点存储阵列数目各种类型的存储阵列的数目存储阵列标识每个存储阵列设定的唯一标识名存储阵列类型存储阵列的类型,包括是生产厂家、所属系列以及规格等存储微码版本存储阵列当前安装的微码版本号存储配置容量存储阵列当前配置的磁盘总容量存储采用RAID方式存储阵列各逻辑卷采用哪种RAID数据保护方式存储CACHE容量存储阵列内配置的CACHE内存容量磁盘标识每个磁盘在存储中的标识名磁盘的规格存储阵列配置的磁盘规格,包括:单盘容量及转速主机通道卡标识主机通道卡在存储中的标识名主机通道卡类型存储配置主机通道卡的类型,例如:光纤、SCSI、UltralSCSI、ESCON等类型的通道卡主机通道卡数目存储配置的各种通道卡数目磁盘适配卡标识磁盘适配卡在存储中的标识名磁盘适配卡类型存储配置的磁盘适配卡的类型,例如:光纤、SCSI、UltralSCSI、SSA等类型的适配卡LUN标识存储中划分的每个逻辑卷的标识热备盘配置数存储阵列当前配置的热备盘数目存储设备相关配置元素相关联配置元素说明主机与该存储设备相关的主机管理员存储设备的管理员服务合同存储设备的维护合同购置合同存储设备的购置合同q 数据库数据库基本属性属性说明软件名称数据库软件名称版本数据库版本信息关键级别数据库的关键级别序列号产品序列号搜索代码数据库的唯一ID厂商数据库厂商用途本数据库用于哪些应用状态数据库状态(即配置元素状态)数据库名数据库实例名数据库端口号数据库的端口号数据库的位数32/64位安装的选项指数据库已经安装的选项,如分区、并行等归档方式日志归档方式信息归档日志目录如果采用归档方式,则列出归档日志目录共享内存的大小共享内存的设定大小(MB)数据设备名数据库内数据文件或数据设备名数据库相关配置元素相关联配置元素说明主机与该数据库相关的主机管理员数据库的管理员服务合同数据库的维护合同购置合同数据库的购置合同q 业务(业务和子业务均属于业务类CI进行配置管理)业务基本属性属性说明业务名称业务的名称版本版本信息关键级别业务的关键级别搜索代码业务的唯一ID数据库实例名与业务关联的数据库实例中间件端口号与业务关联的中间件端口用途业务用途状态业务的状态厂商应用软件厂商业务相关配置元素相关联配置元素说明父业务如果是子业务,填入上级业务搜索代码;否则,填为”无”;主机与该业务相关的主机数据库与该业务相关的数据库中间件与该业务相关的中间件管理员业务的管理员服务合同业务的维护合同搜索代码购置合同业务的购置合同搜索代码q PC属性说明设备名PC的设备名称搜索代码PC的唯一ID型号PC的型号序列号PC的序列号状态PC的状态用途PC的用途CPUCPU主频内存内容容量硬盘硬盘容量操作系统操作系统名称和版本业务PC所承载的业务IPIP地址位置PC的安装位置管理员PC的管理员服务合同PC的服务合同购置合同PC的购置合同q 配套设施属性说明设备名机房配套设施的设备名称搜索代码配套设施的唯一ID型号配套设施的型号产品序列号配套设施的产品序列号状态配套设施的状态位置配套设施所处的位置用途配套设施的用途管理员配套设施的管理员服务合同配套设施的服务合同购置合同配套设施的购置合同q 合同属性说明合同名合同名称对象合同主体对象编号合同编号搜索代码合同的唯一ID位置合同存放位置管理员合同管理人员签约厂商合同签约厂商q 人员属性说明姓名维护人员姓名搜索代码维护人员的唯一ID办公维护人员办公室号码维护人员号码邮件地址维护人员邮件地址地点维护人员工作地点组织维护人员所属的部门职务人员职务IT组别维护人员所属的维护组q 介质/文档属性说明文档名称文档名称搜索代码文档的唯一ID用途文档用途状态文档状态位置文档存放位置管理员文档管理员3 运维管理流程关系和运维支持体系模式3.1 运维流程相互关系上一章是第一阶段各运维流程的详细描述和实际应用流程举例。

      但是,由于IT环境从总体上来说是一个不可分割的有机体,所以上述各流程是不可能独立运行的,为了提高IT运维管理的整体性,各流程之间必须设计接口如下是上述四个流程之间的接口关系图:如下为各接口的几个关键要点:1. 业务部门或IT用户与IT的接口主要表现在:· 用户提交事件或咨询请求给帮助台,帮助台在整个事件处理过程中保持与IT用户的沟通,直至解决方案的确认和事件请求的关闭· 如果在管理流程中允许变更请求可以由用户提交,则IT用户可以把RFC提交给变更管理人员2. 事件管理流程的接口:· 监控系统发现的故障或报警输入到事件管理流程· IT用户的事件或服务请求输入到事件管理流程· 问题管理流程分析事件记录,确定问题· 提出变更请求RFC到变更管理流程实施事件解决方案,解决事件· 事件管理流程查询CI配置信息,进行事件的分析,诊断和解决3. 问题管理流程的接口:· 事件记录输入到问题管理流程进行问题分析· 提出变更请求RFC到变更管理流程实施问题解决方案,解决问题· 问题管理流程查询CI配置信息,进行问题的分析,诊断和解决4. 变更管理流程的接口:· 事件管理和问题管理提出变更请求RFC到变更管理流程实施解决方案,解决事件或问题· 变更管理流程查询CI配置信息,如相互关系等,进行变更的风险,影响分析等· 变更请求处理完毕后,与配置管理协调以更新相关CI信息5. 配置管理流程的接口:· 给事件管理,问题管理和变更管理等运维流程提供CI信息以上各流程还需和报表系统建立接口,以根据各自管理需求产生相关报表。

      3.2 整体运维管理模式支持体系通过在IT部门建立以上各符合ITIL指导框架的流程规范和设计各流程的相互关系及流程接口,可以在IT部门建立如下的三级支持体系:帮助台一线支持/配置管理员IT用户二线支持/问题分析专家第三方网络支持 主机支持 … 数据库支持监控系统事件经理问题经理配置经理变更经理一线二线帮助台结合移动公司BOSS运维的具体情况,本规范有如下建议:· 帮助台人员必须7*24接受事件和分派事件· 一线人员一般是对系统和业务提供初始支持的维护人员,配置管理员也可由一线人员承担,负责配置管理数据库的维护工作· 二线人员一般是对系统和业务提供专业支持的维护人员,常按系统和业务分成不同小组,分别解决相应的事件;二线人员在问题管理流程中也作为相应领域的问题分析专家,负责对该类问题的调查和诊断· 所有流程的责任人(包括事件经理,问题经理,配置经理和变更经理)负责该流程的整体管理和资源协调,常由较资深的维护主管承担· 流程中的几个角色可以由同一个人承担上图从三层支持的流程角度描述了运维管理模式支持体系,这里的重点是不同层面人员需要不同的技能和管理的侧重点,通过该支持体系,可以保证IT部门在处理IT事件和变更等日常工作中,具体岗位和人员的角色职责的明确定义,具体的运维流程与ITIL规范相一致,从而保证整个IT管理系统的高效、平稳地运作,同时能和外部的厂商或合作伙伴实现有机结合。

      4 附录4.1 ITIL国际规范简介为加强对BOSS系统的管理和维护,规范IT运行管理和操作,实现信息系统的自动化运行管理,提高系统可靠性、可用性,保障业务的稳定,特制定本规范,指导各省采用规范化的IT管理模式,建设集中式服务管理平台和管理流程本规范中流程管理的理论依据参照ITIL(Information Technical Infrastructure Library)服务管理体系,这是在全球IT管理业界公认的指导性框架4.1.1 ITIL国际规范简介ITIL由CCTA(英国国家电脑局)颁布,这是一套IT部门用来计划、研发、实施、运维高质量服务的标准管理库它把各个业界在IT管理方面最好的方法归纳起来,变成规范,旨在为企业的IT部门提供一套标准的IT管理方法, 使这些企业的IT部门可以站在”巨人”的肩膀上, 直接按照国际先进的IT管理思想和方法来管理和运行IT,协助IT部门建立以服务为导向的IT运作它一经推出,立即被广泛采用,目前在全球已被多于100,000家在各行业处于领先地位的企业所采用ITIL包含了一系列IT部门进行IT服务支持和实施的规范性流程,以及关于IT服务管理的最佳经验,包括帮助台、突发事件管理、变更管理等运维管理流程和服务级别管理、可用性管理等规划管理流程,通过这些流程规范的实施,可以将IT部门的管理工作从被动式服务转向主动式服务,并通过相应管理工具的集成, 为IT工作人员和IT管理人员提供一个灵活量化的服务管理平台,从而使已往繁杂的IT管理变得有序而轻松。

      ITIL标准库里的流程,可以分为两大组:¨ 服务运行管理流程,包括帮助台/突发事件管理,问题管理,变更管理和配置管理和发布管理等¨ 服务规划管理流程,包括服务级别管理,IT财务管理,容量管理,IT连续性管理和可用性管理等,最近把安全管理也纳入了进来两者的主要区别在于,服务运行管理流程是日常性的,目标是处理日常的维护性管理工作、包括处理事件、控制变更等,以保证IT系统的稳定性,可靠性和用户的满意度;而服务规划性流程是通过服务目标的规划、确定、监控和改进,来确保日常的IT服务水平达到所需要的目标,并实现IT服务的持续性改进, 通过两者的结合,可以帮助IT部门提供面向业务和用户的IT服务,通过流程化、规范化的IT服务管理模式,帮助IT部门真正实现IT服务的业务价值如下为各流程的简要介绍:服务台(Service Desk、HelpDesk),也称为帮助台,IT服务管理与用户的单一接口,受理并处理用户的服务请求Ø 事件管理(Incident Management),它和帮助台一起组成事件处理流程,有效解决各类IT突发事件,尽快恢复IT服务Ø 问题管理(Problem Management), 寻求IT故障的根源,解决存在的问题,从而消除或减少IT事件的发生。

      Ø 配置管理(Configuration Management),管理各IT资产系统(配置元素,CI),包括相互间的关联与依赖关系Ø 变更管理(Change Management), 对变更请求进行记录、跟踪与管理,消除或减少IT变更对生产环境和系统的影响和风险,保证变更的平稳运行Ø 发布管理(Release Management),确保IT系统和软件的有效实施和版本管理Ø 服务级别管理(Service Level Management),保证整个业务系统的服务等级或水平,实现量化管理Ø 可用性管理(Availability Management),监控所有重要IT资源,保证整个业务系统的可用性Ø 容量管理(Capacity Management),监控和提高系统性能,进行性能规划Ø IT连续性管理(Service Continuity),建立业务持续计划,保证系统的高可用性,以实现业务的持续运行IT财务管理( Finacial Management), 包括IT预算管理,成本管理和收费管理安全管理(Security Management),对应用系统,网络及所有服务器提供可靠的安全保护。

      ITIL服务框架帮助IT部门将目光转向了基于流程、关注服务品质、满足服务等级要求、面向用户的一系列服务管理范畴,它帮助IT管理人员回答了”IT部门能提供什么服务”的问题,也回答了”如何实施高质量IT服务”,更回答了“以什么可衡量的方式和标准”提供满足用户和业务需求的服务的问题参考ITIL管理体系来建立运行管理平台、管理制度和流程,设计相应人员职责角色,优化管理组织结构,选择和配置各类管理工具,通过人员(People)、技术/工具(Technology)和流程(Process)的有机结合,有效实现上述项管理,并集成为一个整体的IT运行管理系统,是实现IT运维管理标准化,规范化的重要步骤4.1.2 分阶段实施方法ITIL是综合性的IT服务管理体系,包含了全部IT管理流程规范,但IT管理流程的构建或规范化是一个长期的过程,没有任何一家企业可以让自己的IT部门在一夜之间把所有的ITIL规范流程建立起来,一步使自己的IT管理变得成熟起来因此,有计划、分步骤地将ITIL中所描述的各流程应用在日常的系统运行维护和管理中去是现阶段最切实可行的方法时间IT价值人员 – 流程 – 技术• 配置管理• 突发事件管理• 问题管理• 变更管理• 日常运营维护• 服务级别管理• 可用性管理• 安全管理• 发布管理• 容量管理• IT财务管理• 服务连续性管理利润中心运维管理服务管理根据ITIL的建议和实践经验,以上是比较常见和可行的分阶段实施方案,其中的第一阶段包括帮助台/突发事件管理、配置管理、问题管理和变更管理, 所有这些流程组合成ITIL的运维管理流程规范,属于上述的服务运行管理流程。

      在第一阶段实行运维管理规范流程的目的,是通过采用ITIL国际标准和全新的IT管理结构,综合企业信息系统的各种资源,包括人员,流程和技术,形成全面、统一、集中的管理构架及服务管理流程,确保信息系统能为企业发展提供可靠、高效、安全的IT服务上述的运维管理流程和日常性运维工作是不同的,日常性运维工作是针对不同的系统平台和应用进行的例行工作,如数据库管理、数据备份等等, 而运维管理流程是通过规范的流程来处理来自日常性运维工作中出现的突发事件,提出的变更请求等,包括所有在IT运行环境中必要的管理活动和衡量方法以推动和维护IT服务和生产环境能满足服务级别协议和业务目标, 通过与日常性运维工作的结合,将管理着眼于”监视和控制”以确保IT基础设施的稳定性, 实现规范性的流程管理, 确保IT服务及IT的相关运作环境达到所业务所需要的服务级别日常性运维工作在大多数IT部门里被认为是后端支持,所以动作和角色价值经常被低估然而,高效的运维人员、相关工作流程和运维工具对于高质量的IT服务是很关键的没有这些基础性工作,运维管理流程要成为7*24的连续性流程是不可能的,日常性运维工作通常包括:Ø 系统资源状态/警告管理Ø 输出和打印队列管理Ø 备份管理Ø 客户端,服务器和网络管理Ø 用户管理Ø IP地址管理Ø 数据库管理Ø 语音设施管理Ø 安全管理Ø 协调预防性维护Ø ……下图为第一阶段四个运维流程之间的总体关系图:由此可见,帮助台作为IT事件来源的中心接口,接受和登记事件并通过事件管理流程进行统一处理解决,问题管理流程对已发生的事件或紧急重大事件进行根本原因的分析,从而解决根本问题,防止事件的发生或重复发生;而变更管理流程通过提出变更请求实施问题/事件的解决方案,并通过分析和控制变更的风险和影响来确保变更的平稳实施;同时,配置管理给事件管理和问题管理提供配置信息,进行原因分析和确定解决方案,而变更管理通过了解配置元素信息和相互关系,确定变更的潜在影响和风险,并通过通知配置管理更新配置信息,保证配置元素的正确性,以确保事件管理和问题管理能得到所需要的最新的配置信息。

      通过以上四个流程的建立,可以使日常的运维工作流程化,职责角色更清晰化, 从而使解决问题的速度和质量得到有效提高,使IT部门内的相关支持信息更为畅通和透明,使支持服务的信息更为完整和有效,实现知识积累和知识管理,并可以帮助IT部门更好地进行量化管理和设定优化指标,进行持续地服务改进, 最终能够为业务部门和用户提供更高质量的服务并提高他们的满意度,把IT部门建设成为规范的IT运维中心第二阶段的流程管理目的是实现服务管理, 重点在于在企业的IT环境中了解业务的IT服务级别需求,以此定义双方同意的服务级别,如可用性需求,并通过标准的流程进行服务级别的监视,汇报和改进,最终实现量化管理,通过分析实际服务水平和预定的服务目标之间的差距制定质量改进计划, 实现连续的质量改进循环,把IT部门建设成为真正的服务中心 第三阶段是实现业务和IT的战略整合, 通过标准流程评估IT服务的在企业中的市场, 基于业务需要定义IT如何对企业价值链做贡献, 使IT部门最终能够成为用户的业务合作伙伴,最终把IT部门建设成为利润中心4.2 名词解释ITIL国际规范CCTA(英国国家电脑局)开发的ITIL,这是一套IT部门用来计划,研发,实施,运维高质量服务的标准管理库。

      它把各个业界在IT管理方面最好的方法归纳起来,变成规范,旨在为企业的IT部门提供一套标准的IT管理方法帮助台IT服务管理与用户的单一接口,受理并处理用户的服务请求事件管理和帮助台一起组成事件处理流程,有效解决各类IT突发事件;尽快恢复IT服务问题管理寻求IT故障的根源,解决存在的问题;从而消除或减少IT事件的发生配置管理管理各IT资产系统(配置元素,CI),包括相互间的关联与依赖关系变更管理对变更请求进行记录、跟踪与管理,消除或减少IT变更对生产环境和系统的影响和风险,保证变更的平稳运行发布管理确保IT系统和软件的有效实施和版本管理服务级别管理保证整个业务系统的服务等级或水平,实现量化管理可用性管理监控所有重要IT资源,保证整个业务系统的可用性容量管理监控和提高系统性能,进行性能规划IT连续性管理建立业务持续计划,保证系统的高可用性,以实现业务的持续运行IT财务管理包括IT预算管理,成本管理和收费管理安全管理对应用系统,网络及所有服务器提供可靠的安全保护事件指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背服务水平协议的情况,事件也包括一个用户的请求重分配规则事件的及时、正确分配和接手处理是确保事件在目标服务时间内解决的关键因素。

      申告指因IT系统或应用原因引起的用户投诉或数据差错故障指系统或应用中存在的错误或非正常因素,导致部分或全部业务不可用或者服务不正常咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要技术人员进行后台数据处理的要求维护作业支持人员的日常维护作业或临时进行的维护作业事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型: 用户, 系统管理工具事件优先级优先级是事件管理流程的一个关键要素优先级决定处理事件的顺序及所需的努力事件的优先级通过综合衡量事件的影响度和紧急度得出影响度影响度用于衡量事件的业务严重程度,通常等于事件对服务水平的影响程度影响度通常通过问题所影响的人数、关键系统数以及服务故障所造成的损失紧急度紧急度表明解决问题所需的速度具有高影响度的问题默认并不一定需要立即解决事件升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为”类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”事件状态事件状态表明事件所处在整个生命周期中的不同状态,如新开事件,一线处理中,已关闭等。

      事件结束代码事件结束代码说明了事件是在何种情况下关闭的事件经理作为事件流程的负责人一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持二线支持人员是相关问题领域的专家他负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案尽快恢复服务三线支持人员一般由第三方厂商承担事件流水号系统自动生成的工单号码事件持续时间事件从发生到解决的时间配置元素CI需要被管理的每一个IT系统或设备配置管理数据库CMDB是一个数据集合,存储所有配置管理的数据和信息配置元素属性表示配置元素CI的一项信息,如序列号,版本等配置元素状态配置元素在整个生命周期中的不同状态,如已登记,维修中等配置元素关系不同配置元素之间的相互关系,如联结,父子等搜索代码在配置管理数据库(CMDB)唯一能识别配置元素的代码,并以此进行配置元素的搜索等问题优先级别问题需要找到解决方案的紧急程度问题影响程度问题对IT环境的影响程度,包括对其他IT系统,对相关IT人员等问题状态问题在整个生命周期中的不同状态,如已登记,处理中等问题分类从问题从属的系统或技术架构的类型来进行分类,如数据库,服务器等问题性质根据问题的不同来源进行分类,如事件记录主动性分析等 问题结束代码根据事件结束的不同方式赋予不同的变同方法,没解决等流程角色在问题管理流程中的的不同角色,具体包括问题经理, 问题分析专家等变更优先级别变更需要得到实施的紧急程度变更风险实施变更可能带来的风险变更状态变更请求从提出到实施到结束的整个生命周期中的不同状态结束代码根据结束变更的不同方式赋予不同代码变更类别变更的不同来源进行类别划分变更类型从变更从属的系统或技术架构的类型来进行分类流程角色在变更管理流程中的的不同角色, 具体包括变更请求者, 变更经理, 变更顾问委员会CAB等, 变更主管等RFC对问题的解决方案进行评估,通过变更请求(RFC)进行测试和实施。

      根据RFC对业务的影响和成本进行评估并决定继续进行与否CAB (Change Advisory Board)来帮助和支持变更经理,CAB的成员根据变更的实质可以包括客户代表,运维支持,应用开发和供应商等跟变更有关的人员回退计划用以在实施阶段出现问题或紧急状况时需要把变更回退回去 19 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.