
网络设备巡检服务工作规范.doc
34页信息中心网络设备巡检效劳工作标准〔H3C设备网络〕V1.0信息中心目录1概述22巡检工作流程22.1巡检前期准备22.2数据采集阶段22.3数据分析和报告生成阶段22.4汇报和满意度调查阶段23网络巡检数据采集方法23.1手工数据采集方法23.2网络管理平台数据收集方法23.3巡检工具数据采集方法24网络巡检效劳基准数据库的建立25网络巡检工作内容25.1巡检工作的主要内容25.2网络巡检工作技术涵盖26网络系统巡检根本判断标准27设备相关信息收集27.1软件版本及硬件信息分析2当前设备硬件信息2当前设备运行软件信息27.2设备板卡硬件配置信息分析27.3设备运行状况检查2设备CPU工作状态检查2设备CPU利用率分析2设备MEMORY使用状态检查2设备MEMORY利用率分析表27.4设备运行状态检查2电源的工作状态2风扇的工作状态2设备工作温度28端口的可用性、准确性检查28.1端口状态检查2根本网络接口状态分析2接口半/全双工模式和链路类型2接口稳定性统计信息28.2端口状态检查表29设备端口负载及流量检查29.1设备缓存信息检查210 网络架构、配置信息分析210.1网络构造检查2检查内容2检查方式210.2网络配置信息检查2检查内容2检查方式211LOG信息检查211.1标准的LOG格式211.2LOG日志等级211.3日志信息分析表错误!未定义书签。
关于文档为保障**信息中心网络的平稳运行,将在每月进展网络巡检,并根据巡检结果给出相应的网络系统改良和优化建议本文档面向**的技术人员和外部支持公司网络工程师,通过参考本文档,共同完成对**信息中心网络运行状况的检查与分析通过本文档使**技术人员和外部支持公司网络工程师充公了解**信息中心对网络巡检的根本要求,以该标准为参考,使得网络系统巡检工作更加标准化、标准化由于网络技术的不断开展和设备的更新换代,本标准需要逐步地更新、完善,增加网络设备硬件、软件、固件的新版本和新硬件的内容同时,随着网络安康效劳的不断深入,对网络系统检查的深度和范围也将发生变化,本标准也会逐步地完善文档适用对象本文档仅适用参与**网络工程相关技术人员和外部支持公司的网络工程师1 概述为确保**信息中心网络平安生产,提升网络效劳质量,确保设备的正常运行,将每月对**信息中心网络设备进展巡检,巡检范围根据巡检工作需要而确定,通过对网络设备的数据采集和分析,能够对**信息中心网络设备的状态具有更加深入地了解网络巡检是指通过标准的方法和流程定期地对客户一定范围内的网络进展网元级的系统检查,内容包括现场数据采集、分析、客户报告生成等。
通过对关键网元设备的关键检查点参数进展数据采集、并将采集到的数据与有关标准进展比拟,从而确定关键网元设备所处的运行状态通过定期网络巡检,可以及时发现网络中可能存在的隐患,并消灭在萌芽状态2 巡检工作流程网络巡检工作分为前期准备、现场数据采集、数据分析、报告生成和汇报、满意度调查和问题整改追踪等五个阶段效劳流程如下:2.1巡检前期准备在网络巡检的前期准备阶段,工程师需要在与客户进展充分沟通的情况下,确定要巡检的设备范围及巡检重点,形成"网络巡检方案书"网络巡检书至少包括:l 巡检设备范围和巡检工作重点l 巡检各个工作环节的方式l 数据采集的命令集l 协商具体的巡检时间安排l 巡检报告输出样表和图形在得到客户认可的情况下,进入下一阶段的工作2.2数据采集阶段在网络巡检的数据采集阶段,对于网络数据采集的手段和工具需要得到用户的授权,遵守用户运行管理的相关规定,在指定时间和网络设备范围内进展数据采集工作在用户的协助下收集相关网元的技术数据,并记录输出结果2.3数据分析和报告生成阶段巡检工程师对现场采集到的数据进展分析,形成"**信息中心**中心网络巡检报告"经过南天公司的网络专家审核通过后,由工程师负责以纸质文档或电子文档的方式提交给客户。
2.4汇报和满意度调查阶段通过定期交流的方式,讨论巡检工作中发现的问题及隐患,给出网络运行状况的检查、评估及建议,并进展问题跟踪同时进展客户满意度调查,以便发现和纠正工作中的问题,改良网络系统巡检工作3 网络巡检数据采集方法网络巡检效劳的数据采集方法有两种,一是手工命令采集,并配合网管平台进展辅助性数据采集的方法;一是巡检工具数据采集的方法3.1手工数据采集方法手工采集就是登录到网络设备上,通过手工输入命令并记录输出结果的方式进展数据采集为加强手工数据采集的准确性和合理性,需要对数据进展屡次,重复性数据收集如考量CPU的利用率和MEM的利用率等信息,可以采用日起、日中、日结等三个阶段,分时段收集并进展汇总比对于网络设备运行状态、数据流量等信息的趋势性数据采集需要结合一定时间段数据的采集工作,需要利用网络管理系统进展相关数据的采集工作3.2网络管理平台数据收集方法通过网络管理系统收集相关的数据,可以进展一个阶段的趋势分析,以便更加准确地了解网络系统的整体运行情况,并可以与手工数据采集的结果进展比照,确保数据采集和分析的合理性和可靠性3.3巡检工具数据采集方法通过H3C提供的专用巡检工具进展数据采集。
该工具集合了常用的设备状态检查的命令,可以自动化收集输出结果,并在后期导出巡检报告但是需要H3C提供软件及其授权在没巡检工具软件的情况下,可以由第一巡检方法来替代4网络巡检效劳基准数据库的建立由于网络系统的巡检效劳是一个长期的、持续性的工作,首先需要对网络系统具有一定的了解,建立一个根本信息库主要包括:Ø 设备清单:设备名称、IP地址、位置、功用、序列号等Ø 设备模块硬件配置:模块种类、型号等Ø 设备软件版本Ø 设备使用、维修记录Ø 设备性能基准,包括CPU、Memory利用率、设备端口流量的初始数据等Ø 设备端口信息:相关计数器初始状态通过第一次巡检完成根本信息库的建立,作为以后巡检工作的数据比照性分析的根底和依据,并保持数据更新,动态调整根本信息库的参考点5网络巡检工作内容5.1巡检工作的主要内容本工程中,网络巡检工作中涉及的相关内容如下:1) 设备根本信息收集采集设备的根本信息,包括用户定义的设备名称、设备序列号、设备型号、运行的软件版本、内存大小、CF卡的大小等2) 设备运行状态检查主要采集和分析网络设备的CPU、Memory利用率,并在可能是的情况下,观察其变化趋势3) 设备管理运行环境检查主要通过设备的相关命令收集网络设备的运行环境,主要包括机框内部各个检测点的温度及其变化,电源工作状态和工作输出电压等相关信息。
4) 场地环境检查检查设备的运行环境,如机房温度、湿度、设备供电、网络线缆走线等5) 网络设备硬件检查检查设备状态、设备连线状态等6) 网络设备日志检查使用display命令,收集设备运行日志,并做分析7) 核心设备的端口可用性、准确性检查使用display命令查看设备各端口的工作情况,包括端口的输出、输入错误丢包信息等,buffer占用情况和缓冲器溢出现象等8) 核心设备端口负载及流量检查通过网管及其他手段,对设备端口的带宽占用、负载和流量进展统计分析,便于掌握网络设备及其连接线路的情况9) 网络系统总体性能评估针对巡检的内容及分析结果,对网络运行的整体情况做评估5.2网络巡检工作技术涵盖网络系统巡检工作主要涵盖以下技术内容:工程分类参数数据来源设备根本信息软件Comware Version命令采集Bootstrap Version命令采集启动与运行Boot-loader命令采集uptime命令采集硬件Device命令采集Flash命令采集NVRAM命令采集Total Memory命令采集SDRAM命令采集设备运行环境环境温度命令采集电源命令采集风扇命令采集性能CPU利用率Peak Util命令采集AvgUtil命令采集内在利用率Peak Used Memory命令采集Avg Used Memory命令采集线路稳定性网络端口In DropsOut Drops命令采集网络事件LOG6网络系统巡检根本判断标准我们将依照依据华三公司的技术指标和业界遵循的阈值、惯例和相关技术标准,将采集的数据结果与其对照分析,以判断当前网络运转情况是否良好,根据具体发现的问题提出合理改良意见。
1) 设备运行记录设备运行时间少于7天的〔即运行时间过短的设备〕需要关注,有可能发生意外重启,同样对于设备启动时间过长的设备建议维护性重启2) 设备报警温度3) 电源风扇状态电源正常标准Normal〔指示灯为绿色〕非正常标准Fail〔指示灯为红色〕风扇正常标准Normal〔指示灯为绿色〕非正常标准Fail〔指示灯为红色〕4) CPU内存状态电源〔重点关注后两列〕H3C建议值巡检建议值变化值关注65%<*<74%>35%差值大于10%告警>75%>50%差值大于20%风扇〔重点关注后两列〕H3C建议值巡检建议值变化值关注75%<*<90%>40%差值大于5%告警>90%>50%差值大于10%5) 接口丢包错包率〔增量〕Input dropOutput dropInput errorOutput error关注>0.5%>0.5%>1%>1%告警>5%>5%>5%>5%6) 接口负载率7) 防火墙状态检查工程正常值运行时间>7 DaysCPU使用率<35%内存使用率<40%Failover状态Active、Standby会话连接<+30%地址转换<+30%7设备相关信息收集7.1软件版本及硬件信息分析使用命令display version,查看路由器信息,在巡检过程中用此命令收集来的数据主要作用是:Ø 查看当前设备型号,及当前启动软件版本Ø 查看当前设备已运行时间Ø 查看当前设备引擎内存大小Ø 查看当前设备Flash大小具体关注方法如下:7.1.1 当前设备硬件信息设备硬件信息主要包括如下参数:H3C S7500 with 1 MPC8245 Processor256M bytes SDRAM32768K bytes Flash Memory512K bytes NVRAM Memory〔如图第7-10行〕当前设备引擎号、内在与Flash大小H3C S7500 LPU with 1 MPC8241 Processor128M bytes SDRAM0K bytes Flash Memory0K bytes NVRAM Memory〔如图第18-21行〕如果设备有冗余引擎,此处显示7.1.2 当前设备运行软件信息设备软件信息主要包括如下参数:BootROM Version〔如图第23行〕自启动文件的版本,可用于路由器启动前。












