
ITSMPM问题管理流程手册.doc
14页ITSM-2-PM-01 问题管理流程手册编 号: ITSM-2-PM-01版 本 号: V1.0受控状态: 受控密 级: 内部公开**有限公司ISO20000体系文件问题管理流程手册版权声明和保密须知本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属中国**工程有限公司所有,受到有关产权及版权法保护任何单位和个人未经中国**工程有限公司的书面授权许可,不得复制或引用本文件的任何片断,无论通过电子形式或非电子形式Copyright © 2013**有限公司 版权所有文档信息文档编号:ITSM—2—PM-01文档分类:内部公开起草人:修改人:审核人:批准人:版本记录版本号版本日期修改审核批准修改履历目 录1文档介绍41.1编写目的412适用范围42.术语、定义和缩略语43.问题管理流程53.1流程解释532业务价值533流程原则63.3.1流程原则63.3.2责任人原则633.3再分派原则734优先级原则733.5目标解决时间原则736升级原则733.7关闭原则73.4问题单代码设计83.41问题信息项832问题来源833问题分类83.4.4问题状态83.4.5问题关闭代码93.5角色及职责93.6流程输入及输出93.6。
1流程触发条件93.62输入103.6.3输出103.64流程关闭条件103.7流程描述1137.1作业流程图113.7.2流程活动说明123.8流程衡量指标及报表144.问题管理流程相关表单151. 文档介绍1.1 编写目的本文档描述的内容是依据目前中国**有限公司的IT服务团队现状而制定的问题管理流程文档,其编写的目的是为了有效地解决用户IT环境的问题隐患,减少或消除事件的发生,提高IT服务的质量,为用户提供更优质的IT服务,并且可以促进其他相关服务管理流程,如变更管理的实施通过本文档的定义,将建立一个完整的问题管理体系,从而实现:l 确保分析并确定事件的根本原因,以防止事件再次发生l 确保问题分派了正确支持人员,提高解决率l 根据IT资源情况分派问题优先级l 主动提供预防性措施l 及时改进IT架构的重大隐患l 提高IT服务的可靠性l 降低IT支持成本1.2 适用范围本流程适用于中国**工程有限公司的IT服务团队.管理范围指的是中国**工程有限公司信息部所有运维管理对象.2. 术语、定义和缩略语术语缩略词定义问题管理PM(Problem Management)问题管理旨在发现IT基础设施中事件/问题产生背后的根本原因,包括问题处理和问题控制,其目标在于将IT基础设施中的事件/问题对业务产生的负面影响减小到最低,以及防止与这些错误有关的事件再次发生。
为了实现这个目标,问题管理调查分析事件的根本原因然后采取有关行动改进或纠正这种情形主动问题管理Proactive problem management是指在事件发生之前发现和解决的有关问题和已知错误,从而使事件对服务的负面影响及相关成本控制到最低的一种管理活动通过化被动为主动,IT支持组织提供了更好的服务并提高了自身的资源使用效率.已知错误Known Error问题经过诊断后找到根本原因时所处的状态称之为知名错误在这种状态下,临时措施(workarounds)或永久性的方案已经得到确认如果出现了一个知名错误,则应当提出一个变更请求(RFC)但是,在通过一项变更将此知名错误永久性地修复之前,它仍将作为一个知名错误3. 问题管理流程3.1 流程解释问题管理流程的根本目的是消除或减少事件的发生,此流程分析发生在IT运行环境的事件,确定最常发生或具有最大影响的事件,找出根本原因,然后生成相应的变更请求、临时解决方法或建议的预防性措施来防止事件的再次发生.所以问题管理流程需要和变更管理流程一起来实施找出的解决方案以从根本上解决问题问题通常具有如下特征:l 同个事件,反复发生:在某一时段内,同一个设备的某类事件反复发生l 多个事件,相同症状:同类设备所发生的多个事件具有相同或相似症状l 单个重大故障:单个对业务造成严重影响的重大故障l 变通方法解决的事件:由事件管理上报由变通方法临时解决的事件 l 日常主动发现:定期/不定期对用户基础设施监控或组件巡检和分析,发现的潜在且待根源分析的重大故障/隐患 当上述现象发现或发生时,需创建问题单进行问题分析。
3.2 业务价值l 如果问题已经发生,通过深入有效的诊断和调查,阻止问题再次发生l 如果没有达到问题的解决目标或者存在风险,问题管理逐步将问题提升到尽可能快地解决速度l 提高服务水平和减少成本l 通过沟通和用户意识的提高,更有效地解决主要事件l 问题管理帮助缩短事件处理周期,以便快速提升IT服务质量l 问题管理过程是基于学习过去经验的概念,过程提供历史数据用于识别趋势和预防失败的方法,减少失败的影响l 通过捕捉,保留和事件解决能力以及查询知识库中的数据提高服务台首次解决率3.3 流程原则3.3.1 流程原则l 所有问题都应该被完整准确的记录下来,并保证相关信息应尽可能详细.l 所有对用户业务环境可能造成影响的问题都应通过问题管理流程处理,并遵守流程定义的相关标准、政策和指导原则l 应该定期(每季度)产生和回顾问题管理报表,以改进问题管理流程,对未解决的问题,应该举行定期(每季度)的问题管理会议进行讨论对其评估与分析. l 应该定期(每年)对流程进行回顾,以改进问题管理流程3.3.2 责任人原则责任人原则用来确保每个问题在任何时段都有适当的人员负责,而全面落实责任制需要实行问题的有效管理方案,从而保证问题处理的及时性及有效性。
· 一旦问题单提交后,问题管理负责人全权负责该问题· 如果需要向问题发起人通知处理情况,由问题管理经理负责3.3.3 再分派原则再分派又称转派,指第一次分派后被分派对象,将问题单分派给其他部门或个人.再分派政策是另一项关键的政策,确保问题单不被过于频繁的相互转派,以至于无法在规定时间内得到解决· 所有问题单的转派必须通过问题管理负责人3.3.4 优先级原则问题的优先级表明了该问题对服务所产生的业务影响它是评定问题处理优先等级的一个重要指标中国**工程有限公司的问题优先级定义同事件优先级定义,可参考《ITSM-3-IM-01事件管理流程策略》.3.3.5 目标解决时间原则为了更好控制问题的有效解决,整个流程被分解成几个组成部分每个流程的阶段都设定了目标时间问题的目标时间与事件的明显不同,这是由于两个管理流程目标不同决定的通常,事件比问题的目标时间更严格问题管理的目标时间参见《ITSM-3-PM—01 问题管理流程策略》3.3.6 升级原则升级原则的目的是,对于不同优先级的问题,确保分配到合适的资源来解决问题为了达到这个目的,定义了升级原则的时间框架.当达到下列时间时,如果问题还未解决,将触发升级原则。
升级原则参见《ITSM—3-PM-01 问题管理流程策略》3.3.7 关闭原则l 只有问题管理负责人才有权关闭问题单l 问题单不会被自动关闭3.4 问题单代码设计3.4.1 问题信息项问题单信息项参见《ITSM-3-PM-02 问题管理流程代码设计》:3.4.2 问题来源问题来源代码用来标明问题的提出方式,问题来源可以包括以下几种:问题来源 描述 事件流程升级l 单个重大故障升级为问题l 事件流程中通过变通方法临时解决的事件,可作为的问题在问题流程中找到其根本原因和最终解决方案主动分析事件记录l 类似的事件在某个时间周期内(如周/月)反复发生 l 多个事件具有相同症状l 某类事件出现比例高于其他类型事件l 某类事件数量连续数月呈逐渐攀升态势日常运维发现l 日常运维工作中发现的系统隐患或需重视的异常l 已知的中国**工程有限公司应用系统及第三方系统尚未解决的技术缺陷3.4.3 问题分类简单起见,问题采用与事件一致的分类,详见《ITSM-3—IM—01事件管理流程策略》中的事件分类表3.4.4 问题状态问题状态代码表明问题所处的处理状态,问题状态详见《ITSM—3-PM—02 问题管理流程代码设计》。
3.4.5 问题关闭代码问题关闭代码说明了问题是在何种情况下关闭的,结束代码详见《ITSM—3—PM-02 问题管理流程代码设计》3.5 角色及职责问题管理流程角色主要职责问题管理流程责任人l 问题管理解决方案的责任人l 对于整个问题管理解决方案的结果承担责任,并有相应的权限;问题管理经理l 协调问题管理步骤的日常操作l 根据定义的标准,确保问题得到解决并关闭 l 确保问题分派给问题分析专家l 确保问题分析专家在其管辖范围内的可用性和能力问题分析专家l 进行深入的问题分析,以找出根本原因,并提供解决方案问题提交人l 记录问题基本信息并将其与相应事件、CI进行关联l 将问题归类,设定其紧急度、影响度和优先级l 将问题提交给问题管理负责人中国**工程有限公司问题管理流程角色设置参见《ITSM-3-PM—01问题管理流程策略》.3.6 流程输入及输出3.6.1 流程触发条件l 事件升级:Ø 一段周期内,同个事件,反复发生(如一个项目,在一月发生三次以上同样事件)Ø 多个事件,具有相同的症状Ø 单个重大故障l 运行周报/月报的趋势分析l 通过巡检发现的系统层面重大问题/隐患;可通过例会制度讨论3.6.2 输入l 未解决的事件单,需要通过问题管理流程解决l 已解决的但需要进行根本原因分析的事件l 对事件趋势分析的结果l 虽然尚未发生事件,问题分析专家主动发现的新问题3.6.3 输出l 对事件管理流程的通知l 关闭的问题单3.6.4 流程关闭条件l 问题单分析处理完毕并经过评审,并在判断是否需要提交知识条目后可以关闭。
3.7 流程描述3.7.1 作业流程图3.7.2 流程活动说明1) 主要活动说明:编码活动责任人说明PM.1问题识别和记录问题提交人本步骤的主要目的是识别问题(主动或是被动),创建问题单并确定其分类、根据影响度和紧急度决定问题的优先级.PM2问题评审和分派问题管理负责人这个步骤是问题管理负责人接受到问题单后,判断该问题是否值得解决,或是否可能解决,并据此确定是否正式创建问题.如果确定需要正式创建问题,则将该问题到分派给问题受理员.PM.3问题调查和诊断问题分析专家该步骤确定了问题信息的来源,对问题进行分析,找出问题的根本原因PM.4问题解决问题分析专家本步骤的目的找出已成为“已知错误"的问题的解决方案,如果找到即实施该方案以解决问题PM.5问题关闭问题管理负责人问题管理负责人评审问题并关闭问题记录,通知相关人员.2)分活动说明。
