好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

《运维管理标准》.docx

23页
  • 卖家[上传人]:柏**
  • 文档编号:277582148
  • 上传时间:2022-04-15
  • 文档格式:DOCX
  • 文档大小:30.47KB
  • / 23 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 运维管理标准第一篇:运维管理标准 运维管理标准 概述 运维是管理的核心和重点部分,也是内容最多、最繁杂的部分,主要用于运维部门内部日常运营管理,涉及的对象分成两大部分,即业务系统和运维人员其管理内容又可细分为七个子系统: 第一、设备管理:对网络设备、服务器设备、操作系统运行状况进行监控,对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,如邮件系统、DNS、Web等的监控与管理; 其次、数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复; 第 三、业务管理:包含对企业自身核心业务系统运行状况的监控与管理 第 四、名目/内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理; 第五、资源资产管理:管理企业中各IT系统的资源资产状况,这些资源资产可以是物理存在的,也可以是规律存在的,并能够与企业的财务部门进行数据交互; 第六、信息平安管理:该部分包含了很多方面的内容,目前信息平安管理主要依据的国际标准是ISO17799,该标准涵盖了信息平安管理的十大掌握方面,如企业平安组织方式、资产分类与掌握、人员平安、物理与环境平安、通信与运营平安、访问掌握、业务连续性管理等; 第七、日常工作管理:该部分主要用于规范和明确运维人员的岗位职责和工作支配、供应绩效考核量化依据、供应解决阅历与学问的积累与共享手段。

      第一章 总则 1. 为加强公司各个项目后期的系统运维管理,确保系统能够平稳、牢靠地运行,更好地为客户供应管理服务,特制订本规定 2. 实行预防性维护为主、故障性维护为辅的运行维护管理原则,预防性维护和故障性维护都应遵循事先设计好的程序进行 3. 完竣运维管理体系,建立健全运维规范,提高运维管理效率,并不断提高运维质量 4. 本规定适用全部进入运维环节的项目 5. 运维人员应依据授权,处理本规定中所涉及的业务事项 其次章 主机、服务器及数据库系统的运维管理 1. 依据应用需求,主机、服务器及数据库系统的配备和安装、以及系统资源的使用等由公司项目实施部统一规划 2. 应指定专人作为系统管理员(系统工程师)和数据库管理员,对系统的运行、管理、维护和平安负责,并根据有关规定负责系统和数据的备份与恢复 3. 系统/数据库管理员应定时对系统进行监控和定期的健康性检查,分析系统运行和资源使用状况,并进行必要的优化、调整和修正,准时消退隐患如系统设置发生变化,或重新安装系统,或安装了新软件,应在此后15个工作日内对系统进行亲密跟踪。

      4. 准时解决处理系统运行过程中展露的异样问题和软硬件故障,并实行必要措施,最大限度地庇护好系统资源和数据资源 5. 对于重大软硬件系统故障,应马上通知部门领导,协调服务商,使系统尽快得以恢复运行;对于应用系统引发的系统异样或故障,应准时通知相关人员,并协同解决处理 6. 每季度应对系统主机/服务器/数据库进行一次停运维护,其操作务必严格根据操作规程进行其他非正常性停运(故障引发的除外),应提出书面申请,并经部门领导批准后方可进行同时做好相应的筹备工作,最大限度地削减对业务操作带来的影响 7. 具有系统操作或管理权限的人员调离工作岗位或离职,应马上从系统中删除该用户;如该人员把握超级用户口令,应马上更换口令 第三章 软件系统的运维管理 1. 避开在用户工作时间进行软件版本升级工作,以免由于人为失误造成业务中断 2. 软件系统的安装、升级等操作应保留完好的实施记录 3. 对软件系统进行升级、更新补丁,应首先进行相关的测试,并在确认无误后实施 4. 对软件系统进行升级、更新补丁,或进行系统的重新安装等操作,应在实施前对原有系统及数据进行备份。

      5. 变更系统配置,修改配置文件、参数文件时,应对原始配置数据(或文件)进行保留 6. 软件进行版本升级时,对于不影响业务的升级工作,须以书面形式详尽将规划、计划、措施等报上级主管部门备案;对于影响业务的升级工作,务必提前两周向上级通信主管部门以书面形式提出申请详尽报告规划、计划、措施等,经批准后方可实施 7. 维护人员应定期跟踪所使用系统的软件升级状况和升级后的新功能,必要时提出升级建议 第四章 数据库的运维管理 1. 对于数据库的变更务必有记录,可以回滚 2. 无用表和字段要准时清理 3. 从数据库删除数据必定要先备份再删除 4. 定期对数据库数据进行自动备份,以便在故障发生后尽快恢复最新的数据定期检查备份的执行状况,确保备份操作正确执行 5. 指定专人定期进行备份数据的恢复性试验 1、严格操作原则:在系统上进行可能影响系统运行的参数设置、更改和维护等操作时,须有2人以上在场进行监护和确认,并作好详尽的操作记录; 2、提前沟通确认原则:软件进行版本升级时,对于不影响业务的升级工作,务必提前与客户方进行沟通,避开操作中人为失误造成业务中断;对于影响业务的升级工作,须提前与客户方进行确认,达成全都后方可实施。

      3、遵守保密原则:对被运维系统单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随便复制和传播 第五章 巡检管理 定期了解设备的运转状况,做好系统日常运行的基础数据记录,做到有问题早发觉、早解决,避开隐患,确保设备的完好率,保证系统运行质量 1. 对硬件设备进行定期巡检,是确保系统稳定运行的重要措施,巡检工作包括例 行巡检、节假日和重要大事前的巡检 2. 维护人员应依据工作规划,对维护的设备定期进行预防性巡察检查,巡查过程中应严谨负责,准时发觉问题,重点留意处在卑劣环境下、存在潜在质量故障的设备,巡查要严谨做记录 3. 巡检过程中发觉告警应马上进入处理流程,判定为故障的要马上进入故障处理流程 4. 全部的巡检都应有详尽的记录,包括时间、巡检状况和责任人,并应在巡检纪录卡上签字 第六章 网络管理规范 u 关键业务流程 对以下业务系统流程监控,对业务系统是否正常运行、各项详细参数指标是否超标等进行掌控,避开或降低业务系统故障的发生率 1、单位内部的关键业务流程。

      2、网络吞吐量大的业务流程 3、对系统造成大的压力,频繁使用数据库的业务流程 4、同其它系统集成的业务流程,这些集成会提高应用失败的风险 u 用户体验同系统性能指标相关联 将网络中的全部网络基础架构都进行集中监测,包括对数据库服务器、应用服务器、路由器、交换机、防火墙的监控,收集网络运行信息,将性能数据同单位内部用户的体验相结合来分析网络的性能状况,诊断系统瓶颈 u 建立网络运行基准指标并观看趋势 长期监测并经过对网络运行的观看,分析网络性能的变化和流量等指标的运行趋势;准时发觉网络偏离系统基准模型时的异样状况,分析故障,达到预警的目的,防止更严峻问题的发生 u 设计报警策略,避开警报泛滥 配置报警的依据是依据信息服务管理网的网络运维管理目标,报警设置的原则: 1、对影响网络和业务的重要指标设置报警; 2、消退误报和重复报警; 3、报警应当以多种方式准时发送给相应的负责人 u 创建自动化、规范化大事处理程序 信息服务网络运维,日常处理事务较多,需要在网络、链路和系统运行展露问题时能够有自动化、规范化的处理问题程序,迅速处理各种潜在故障并且安排到相应的负责人,提高工作效率。

      此外可将工程师长期积累的学问和工作阅历系统化和固化,达到迅速定位故障的目的 u 网络服务质量SLA的量化管理 提高网络服务质量的设立量化指标,将其作为整个网络运维管理团队的整体目标信息服务管理网网络性能管理的总体目标包括网络和设备、业务的可用性、网络的吞吐量、带宽使用百分比、网络延时、CPU和MEMORY的负载,对于不同的网络指标还要依据网络的上下级衔接关系分解到每一个子指标,作为对网络故障诊断和性能管理的依据 u 制订网络的升级和改进策略 网络的升级和改进应当以对现有网络和系统性能数据的测量为前提,以对网络整体运行的现状及趋势分析为依据经过对单一网络系统和整体网络系统性能数据的比较、单一网络组件和其它网络组件的数据比较、系统负载量最大时的性能数据和一般负载时的性能数据的比较等,推断是否需要对系统的局部或者整体进行升级,发觉网络系统性能的瓶颈,提出网络系统改进的方法 ² 日常规范 1. 每天两次进行业务系统、网络运行状况、业务流量及对外服务器服务状况监控巡查; 2. 根据规定的时段巡统计并汇总运维表单流量统计、大事统计、问题统计、手里投诉统计等)根据规定的时段查看路由、防火墙等关键系统运行状况,包括网络流量、带宽占用率等,重点检测关键设施,并记录; 3. 处理产品组网络问题应做完好、详尽记录,迅速响应,准时笃定缘由,乐观组织处理,同时记录解决问题的操作过程,问题解决后应准时回复; 4. 对网络资源调配管理(ip资源安排、设备端口划分、链路传输、负载均衡等)、核心和汇聚层等核心网络运维的调试,做好汇报申请并记录。

      5. 故障分析及处理,网络拓扑更新及网络优化网络平安计划实施部署,更新维护录入学问库 6. 处理各种网络故障,并作记录,保障网络正常运行 7. 遇到不能处理的问题时,通知相关人员或准时汇报,并记录; 8. 工作人员要有剧烈的平安意识,巡查时应留意发觉各种可能的平安隐患并准时排解 第七章 请示报告制度 为加强相关信息处理和反馈管理,有效的掌握系统和设备的运行状态,经过规范的请示报告流程,提高运行维护的管理效率 例行性请示报告 1. 根据规程和制度规定的周报、月报、季报和年报 2. 系统升级、交接和重大数据变更请示报告 3. 各类专项请示报告和合理化建议 火速性请示报告 1. 各种事故、严峻设备故障、严峻电路故障、系统运行异样等状况 2. 各项工作中发觉的严峻泄密、平安性事故报告 3. 客户要求的其他火速性报告 其次篇:运维部工作标准 运维部工作标准 1范围 1.1 本标准规定了运维部的工作内容及要求,工作程序及职权、检查与考核 1.2 本标准适用于运维部的日常工作 2职责 2.1 运维部在风电公司领导下,负责公司指定的生产系统和生产区域的行政生产和技术管理工作。

      2.2 运行部负责保障公司设备的平安生产,平安运行,设备的定检、维护、故障消缺和更新改造等工作,负责部门标准化管理工作和文明生产工作 2.3 合理组织生产要素,充塞发挥职工的乐观性,准时全面地完成上级下达的各项任务及生产指标 2.4负责教育培训工作,作好公司平安生产工作 3工作内容与要求 3.1 贯彻执行风力发电公司制订的各种标准制度 3.2 负责运维部岗位和人事,行政管理等工作 3.3明确各班组及各专责人的职责范围,充塞发挥调动各班组和全体职工的乐观性,准时全面地完成厂下达的各项任务和生产、经济指标 3.4定期进。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.