电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

唐山移动WLAN系统应急预案816

14页
  • 卖家[上传人]:hs****ma
  • 文档编号:489662032
  • 上传时间:2023-12-10
  • 文档格式:DOC
  • 文档大小:227KB
  • / 14 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、 XX移动WLAN系统应急预案中国移动通信集团XXXXXX分公司2012年8月07日目录(一) 应急方案启动条件1(二) 应急方案执行原则1(三) 网络结构现状2(四) 重点关注的指标5(五) 故障时需要上报省公司的数据6(六) 破坏原因及破坏结果分析6(七) 预防保障措施7(八) 应急措施7(九) 告警处理9(十) 工作流程图13(十一) 应急资源配备(含备件)13(十二) 知晓X围13(十三) 相关人员联系表14 / (一) 应急方案启动条件 大量WLAN用户投诉无法正常使用,启动应急预案。 全网 WLAN 业务中断,启动应急预案。 若 AC 功能模块出现异常,导致无法登录 AC 系统,无法采集网络数据影响到业务的使用 和省网管中心的监控,启动应急预案。 主用AC硬件故障宕机,启动应急预案。 主用AC与核心S9312的链路中断,启动应急预案。 主用AC业务故障导致下挂所有站点业务无法使用,启动应急预案。 WLAN系统关键双机设备中的主机宕机(核心交换机双机、四层交换机双机、交换机双机、防火墙 双机等),业务中断,启动应急预案。(二) 应急方案执行原则 先抢通,再抢修,尽快恢复业务。

      2、以对业务系统的影响最小化为指导思想,力争业务不中断。 排障过程要将业务影响情况及时上报领导和通知监控室,及时对地市通报。 在网络设计上单台设备的故障是不引起业务的全阻断。在发现单台设备的故障时最主要是要 检查配对的设备是否能负荷故障设备所承载的业务。 由于目前WLAN系统上并没有接入带外管理网络,所以在发现设备阻断故障时必须由本地维护人员到达设备端登陆设备。检查设备运行情况、传输线路情况等,并做好对路由器端口、路由等方面检查记录,确定故障点。为故障处理提供原始记录。 当 WLAN 网络出现严重故障,根据故障现象准确定位故障点,汇聚层问题还是接入层问题。汇聚层设备主要查看 AC 是否正常运行,AP 有没有获取到 IP 地址,AP 与 AC 是否已经关联上,AC 是 否给 AP 下发模板,VLAN 号是否一致。S9312交换机是否正常运行,接入层设备主要查看接入层交换机是否正常运行,所配置的 VLAN 号是否一致,是否有做透传。以上执行原则需在公司的统一指挥下和其它部门一起解决。(三) 网络结构现状XXWLAN 网络采用集中转发模式、AC认证、二层组网和三层组网并存,AC 转发用户数据流到

      3、 S9312 再到RADIUS做推送认证、,AC管理与配置 AP, AC作为用户 DHCP 服务器和认证点。XX本地WLAN网络核心交换机采用华为S9312、AC和AP采用XX三元达、XX虹信和XX京信3个厂家设备,汇聚交换机和POE交换机采用中兴、烽火和锐捷厂家设备进行组网。业务承载传输方式采用PTN设备、SDH设备。下图为网络拓扑图(四) 重点关注的指标需要关注的内容有:1、地址池利用率均值 ,粒度为每天,正常情况下地址池利用率不超过80%。 查看方法:登陆省内数据网管报表分析业务报表WLAN本地报表AC地址池利用率统计查询;2、AC性能,粒度每天,正常情况下CPU和内存利用率都在50%以内;查看方法:登陆省内数据网管设备报表AC查询;3、由于AC原因导致认证失败率,粒度每天,按照集团公司和省公司要求CMCC和CMCC-EDU 认证成功率应保证在99.6以上。 查看方法:登陆省内数据网管报表分析业务报表WLAN本地报表全省AC设备radius认证统计 / radius认证查询;4、无流量AP清单,粒度每天,正常情况不会产生,如果连续几天都为无流量,则需要察看AP是否 吊死; 查看方

      4、法:登陆省内数据网管报表分析业务报表WLAN本地报表AP无流量清单查询;5、 离线AP清单,粒度每天,如果连续多天均为离线状态,需要上报省公司原因 查看方法:登陆省内数据网管(五) 故障时需要上报省公司的数据设备出现故障时,没有数据需要手工上报省公司。(六) 破坏原因及破坏结果分析从统计分析的结果看来,在WLAN 系统上引起故障或有破坏性的原因主要有以下几种:1. 设备本身的原因(软件、硬件)从设备本身的原因来看也可以分为软件Bug和硬件BUG,这一类的故障比较隐蔽,一般需要厂家的协助才能检查出来,所以对于此类的故障要通过加强与厂家之间的沟通来解决,及时升级相关的软件版本和补丁,更换存在隐患的硬件板卡。这类原因引起的故障针对影响X围和规模也会有所不同。2. 传输线路、尾纤等物理线缆的原因传输线路、尾纤等物理线缆由于线路质量,光缆被盗,光缆被挖断等的问题引起的故障一般可能通过设备的LOG文件、端口状态情况等检查出来,对于该类的故障需要加强与传输部门和机房现场人员的沟通来解决。这类原因引起的故障如果在S9312和AC侧一般影响一条传输线路或者某1台AC。但如果发生在接入侧则可能影响某些用户

      5、无法正常使用WLAN 业务。3. 人为原因由于人为配置或操作失误引起的故障,这类的故障是我们管理上要着力避免的。可通过管理制度去约束网络维护人员,代维人员,厂家等在网络上进行的操作。建立起操作审核制度、操作更变规程等相关的规X化制度。4. 自然灾害由于台风、洪涝、地震等各类自然灾害的影响,对机房或动力环境等可能造成严重影响,可能导致整栋机楼、整个城市的瘫痪,从而给包括WLAN 网络在内的整个网络造成严重影响。(七) 预防保障措施在WLAN系统的网络设计上已经避免了单台设备故障和单条链路中断对整个WLAN网络本身和对其上承载业务的影响。在网络上采用了以下技术去保证网络的安全和稳定。 双节点、双平面网络设计在网络拓朴设计上各层面节点都采用了双节点、双平面的设计,严格按照主备设备异局址布放的原则,保证单节点故障或单平面故障时,业务流量都不会受到影响。 多链路、不同传输线路的保护WLAN系统核心交换机和AC设备采用的双链路保护,且各层设备互联链路承载在不同的传输平面上。保证在发生灾害天气、光缆中断时不会造成节点的业务全阻断。3、 主备AC的VRRP快速切换WLAN系统中主备AC采用VRRP协议

      6、,保证主用AC出现故障时,由备用AC来代替出现故障的AC进行工作,从而保持网络通信的连续性和可靠性。(八) 应急措施1、S9312侧故障(1)S9312互联链路为2条,承载在不同SDH传输平面上,当单条链路中断时,全网业务不受 影响。当双链路中断时,可以将链路割接至波分传输平面上,保证业务的快速恢复。 (2)如果发现所有单板的指示灯都不亮,并且所有风扇不转(可通过听声音辨别),或者电源模块的 ALARM 灯亮,则有可能是设备的供电系统出现故障,需要检修。检查电源模块的开关是否已经打开,RUN 灯是否点亮。如果有多个电源模块,请确保至少一个电源模块正常供电。检查电源模块的 ALARM 灯是否点亮。如果点亮,表明电源模块有异常,可尝试通过更换电源模块解决。(3) 当发生无法登陆设备问题,在排除了串口通信、电缆、供电系统方面的原因后,则很有可能是主控板发生了故障。如果系统有主备两块主控板,可尝试将配置电缆连接到备用的主控板上;如果只有一块主控板,可使用备件进行更换。(4)当发现S9312单播转发业务不通时,首先需要检查在设备上能否收到AC的报文。可以使用display mac 命令查看一段时

      7、间内设备接收的mac地址是否有变化。如果发现设备上无法收到AC的MAC,可按如下步骤进行处理:检查设备的上行接口的状态是否正常,如果对应AC接口状态正常,可以 Ping AC对端接口的 IP 地址。如果可以 Ping 通,则可以确认是AC设备出现故障,可通告相关AC进行检修。如果无法 Ping 通,则需要检查设备的对应接口和AC接入设备的下行接口之间的链路,例如电缆是否完好、光模块和光功率是否正常、中继设备是否正常、IP 地址是否正确等。如果可以接收到AC侧MAC,但是下行无法转发出去,则需要检查 S9312 和下游设备之间的连接和通信.检查设备的下行接口的状态是否正常,如果下行接口状态正常,可以 Ping 下游设备的上行接口的 IP 地址。如果可以 Ping通,则可以确认是下游设备或更下游设备出现故障,可通告相关局点进行检修。如果无法 Ping 通,则需要检查设备下上行接口和下游设备的上行接口之间的链路,例如电缆是否完好、中继设备是否正常、IP 地址是否正确等。如果链路都是完好的,则有可能是 S9312 和上层设备之间的通信异常,需要检查路由等设置。2、AC故障(1)主用AC与核心S

      8、9312的链路中断,自动切换到备机工作不影响正常业务使用; (2)当主用AC硬件故障宕机,通过VRRP技术,确保主机出现故障时及时的启用备机,自 动切换业务链路,主用AC自动切换到备机工作不影响正常业务使用;当检测故障主机为硬件故 障后,应及时更换备件,确保问题解决后,经过测试方可将业务切换回主机。(3)主用AC操作故障导致下挂所有站点业务无法使用,配置改动不当会造成用户掉线。(4)当发生主备切换故障时,确保主备状态正常,备份链路和备份对接端口正常。 #show hotstandby group-info 进行主备状态查询 #show hotstandby port-state 进行主备端口查询 (5)当AC系统检测到网络攻击时,以下主要检查项如果发现问题,不影响业务的进行参数调 整;对业务造成影响的及时切换到备机,并处理故障;如果AC查看显示网络攻击并且该AC所 有业务无法使用则切断网络紧急排障。3、汇聚交换机和POE交换机故障(1)硬件故障 如发生交换机遭雷击、漏电、过载、过热、安装操作不当、运行环境恶劣等导致的损坏,或设备自身硬件缺陷,使设备不能正常运行,业务、网管全中断,则更换整机。(2) 供电问题 POE交换机若带的AP过多,可能导致后面的AP供不上电,无法上线带业务,可修改调测 POE供电参数,如果修改不能解决,可以减少AP数量或增加POE交换机。(3)端口环路 当POE交换机个别端口下接的AP存在故障,或网线施工时存在问题,会导致该端口下有环路,引起广播风暴,影响整个热点的AP都无法上线,可在POE交换机业务口下开启AP管理vlan 的环路检测,当有环路时,自动阻塞该端口,保证其他AP业务正常,然后排查该端口。(4) 设备吊死 当设备吊死时,故障现象有时为业务和网管都不通,有时业务是好的但网管不通,一般重启 设备都能解决,如果重启仍不能恢复,按硬件故障处理方法处理。 (九) 告警处理 常见维护中重要告警、常见问题的处理措施: AC部分:1 、设备升级失败无法工作 【处理措施】:(1)AP升级失败后请通过TFTP方式对设备进行升级。 (2)AC升级失败后请在设备开机后通过串口进行复位操作,rescue后恢复出厂操作 系统后再进行最新版本的升级。 【操作

      《唐山移动WLAN系统应急预案816》由会员hs****ma分享,可在线阅读,更多相关《唐山移动WLAN系统应急预案816》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.