
华为移动IP专用承载网日常维护工作浅析.ppt
26页HUAWEI TECHNOLOGIES CO., LTD.HUAWEI TECHNOLOGIES CO., LTD移动移动IPIP专用承载网专用承载网日常维护工作浅析日常维护工作浅析Page HUAWEI TECHNOLOGIES CO., LTD.移动移动IPIP专用承载网简介专用承载网简介维护工具的使用维护工具的使用典型案例介绍典型案例介绍大 纲Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介二期网络核心节点设计二期网络核心节点设计Ø在北京、上海、广州、沈阳、南京、武汉、成都和西安8个城市分别配置2台核心路由器NE5000E(CR),构成8对核心节点;Ø核心节点CR之间采用对称的不完全网状连接方式;根据光缆路由的实际走向及彼此业务的相关性,任何1对同城市的核心节点CR路由器至少与2对其它城市核心节点的CR路由器相联;在每对核心节点CR1、CR2之间建立互联链路;北京北京沈阳沈阳西安西安南京南京上海上海武汉武汉成都成都广州广州Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介二期网络汇聚节点到核心节点连接二期网络汇聚节点到核心节点连接ØBR/AR设备采用NE80/NE80E,构成各省市的汇聚和接入节点Ø方式一:继续保持目前接入节点到核心节点的连接方式,主要是有大区核心的BR/AR节点;Ø方式二:对于部分存在流量迂回的节点采用跨大区连接方式;Ø方式三:对于部分存在流量迂回且传输资源有限的节点。
CR1BR/ARCR1CR2BR/ARCR1CR2BR/ARBR/AR方式一现网方案方式二方式三Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介二期网络接入节点到汇聚节点连接二期网络接入节点到汇聚节点连接Ø接入节点采用对称方式连接到汇聚节点;Ø省内有多个汇聚节点时,接入节点可以参考BR到CR的连接方式BRAR2AR1AR3BR2AR2AR1AR3BR1Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介二期工程网络整体拓扑结构二期工程网络整体拓扑结构Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介Ø中国移动IP专网二期工程IGP继续采用IS-IS路由协议,采用平面路由设计,所有路由器置于Level 2层中;Ø启动ISIS的快速收敛,包括BFD for ISIS;Ø域间路由协议采用BGP-4,在AS边界通过EBGP或静态路由(尽可能用EBGP)控制路由的发送、接收、汇总和属性修改(目前不涉及);Ø中国IP专网全网开通MPLS VPN业务,对于MP-BGP,采用1级路由反射器(RR)设计;Ø路由器管理地址和链路地址的路由由IGP承载;域间路由和VPN内路由由BGP承载,如UMG、专线用户、3G设备地址等。
路由总体设计路由总体设计Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介IS-IS Metric设计设计正常情况下(主用路径):正常情况下(主用路径):Ø地市间直连链路仅对对等地市间流量疏通有效;省会间直连链路仅对对等省间流量疏通有效;其余流量通过“接入——汇聚——核心”逐级汇接链路疏通;Ø节点内部链路设计为低阻链路,便于在网络不同层面的路由优化异常情况下(备份路径):异常情况下(备份路径):Ø当不同核心节点直联链路单组中断时,相关流量在相同方向的另一组链路上收敛;当不同核心节点2组链路同时阻断时,相关流量在AR-AR之间端到端重新收敛; Ø当BR-CR链路单组中断时,相关流量在冗余上行网络汇聚层链路上收敛;Ø当BR-BR省间直联链路中断时,相关流量在上行网络汇聚层链路上收敛;Ø当AR-BR链路单组中断时,相关流量在冗余上行网络接入层链路上收敛;Ø当AR-AR地市间直联链路中断时,相关流量在上行网络汇聚层链路上收敛;Ø当CR1-CR2、BR1-BR2、AR1-AR2链路中断时,相关流量在AR-AR之间端到端重新收敛; Page HUAWEI TECHNOLOGIES CO., LTD.移移动IP专用承用承载网网简介介路径信息表是维护中的重要使用工具路径信息表是维护中的重要使用工具Page HUAWEI TECHNOLOGIES CO., LTD.移动移动IPIP专用承载网简介专用承载网简介维护工具的使用维护工具的使用典型案例介绍典型案例介绍大 纲Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用HWPingHWPing功能介绍功能介绍iManageriManager DMS2000 DMS2000网管软件的使用网管软件的使用iManageriManager D2610 D2610网络分析系统网络分析系统Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用使用使用HWPingHWPing工具,了解网络运行性能工具,了解网络运行性能 HWPing可以用来测量网络上运行的各种协议的性能,它是对Ping功能的增强。
Ø使用HWPing ICMP测试功能,测试报文在本端(RouterA)和指定的目的端(RouterB)之间是否可达,以及报文的往返时间;ØHWPing Jitter用来测试本端(RouterA)和指定的目的端(RouterB)之间传送报文的抖动时间抖动时间是指相邻两个报文的接收时间间隔减去这两个报文的发送时间间隔在测试时,源端以一定的时间间隔向目的端发送数据包目的端每收到一个数据包,就会给它打上时间戳,然后再把这个数据包发回到源端源端收到数据包后就可计算出抖动时间ØHWPing还可以探测TCP、UDP、DHCP、FTP、HTTP、SNMP是否打开以及测试各种服务的响应时间Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用iManageriManager DMS2000 DMS2000网管软件在维护中的使用网管软件在维护中的使用 DMS2000包括拓扑管理、配置管理、安全管理、性能管理、故障管理、资源管理等几个模块Ø日常维护中,最经常用到故障管理,通过故障面板及时了解故障发生点和故障原因,在第一时间内定位并排除故障现象;Ø通过性能管理可以了解设备运行中的具体指标。
Ø安全管理可以授予网管维护人员各种合理的权限,保证网络维护的安全性Ø另外灵活的手工报表提供了详实的统计分析数据Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用iManageriManager DMS2000 DMS2000网管软件在维护中的使用网管软件在维护中的使用采集类型采集指标设备性能采集采集设备采集板的CPU占用率(均值、峰值)采集设备采集板的内存占用率(均值、峰值)单板性能采集采集设备上指定单板的CPU占用率(均值、峰值)采集设备上指定单板的内存占用率(均值、峰值)接口性能采集采集设备接口流入流出流量与带宽利用率 链路性能采集采集链路流入流出流量与带宽利用率,支持流量趋势一级测试点性能采集采集一级测试点之间的平均时延、丢包率、时延抖动一二级测试点性能采集采集一级和下属二级测试点之间的平均时延、丢包率、时延抖动路径性能采集采集路径的平均时延、丢包率、时延抖动Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用iManageriManager DMS2000 DMS2000网管软件在维护中的使用网管软件在维护中的使用Page HUAWEI TECHNOLOGIES CO., LTD.维护工具的使用工具的使用iManageriManager D2610 D2610网流分析系统在维护中的使用网流分析系统在维护中的使用 NetStream技术就是这样一种基于网络流信息的统计与发布技术,它可以对网络中的通信量和资源使用情况进行分类和统计,及时发现网络瓶颈,提供针对不同业务和应用的统计数据,基于各种业务和不同的QoS进行管理和计费 。
Ø应用应用NetStream技术技术Ø采用采用D2610网流分析系统网流分析系统 iManager D2610网流分析系统作为一个IP网络流量流向分析工具,可为用户提供丰富的网络流量、流向的数据信息,为运营商进行市场策划、网络设计优化、流量工程分析、流量计费结算等提供强大支撑 Page HUAWEI TECHNOLOGIES CO., LTD.移动移动IPIP专用承载网简介专用承载网简介维护工具的使用维护工具的使用典型案例介绍典型案例介绍大 纲Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析Ø典型故障一:IP地址重叠导致路由表紊乱Ø典型故障二: IP专用承载网POS链路中断故障分析Ø典型故障三:链路能够ping通,但严重丢包 移动移动IP专用承载网做为软交换业务的承载网络,同时又依托于底层的传专用承载网做为软交换业务的承载网络,同时又依托于底层的传输链路来实现网络的连通,因此对于在发生业务故障的情况下,必须综输链路来实现网络的连通,因此对于在发生业务故障的情况下,必须综合各方因素来进行网络故障定位合各方因素来进行网络故障定位。
Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障一:IP地址重叠导致路由紊乱IP专用承载网是集团公司统一规划的大规模网络专用承载网是集团公司统一规划的大规模网络IP专用承载网承载多种专用承载网承载多种VPN业务业务业务的接入,都必须站在全局的高度来统一规划业务的接入,都必须站在全局的高度来统一规划常见故障特点:常见故障特点:• 路由转发表生成错误的路由条目,导致目的地址不可达路由转发表生成错误的路由条目,导致目的地址不可达• 源与目的之间单向源与目的之间单向ping通:通:A不能不能ping通通B,但,但B能够能够ping通通APage HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障一:IP地址重叠导致路由紊乱具体案例:具体案例:S3526ER2631ENE40PENE08ES2016CE网管网管server10.0.102.235PECE10.0.115.15810.0.115.16110.0.115.16210.0.101.6410.0.102.235?10.0.119.16/28?承载网承载网10.0.115.190S3526E防火墙(二层)防火墙(二层)MA5200R283110.0.119.154/2710.0.119.13/3010.0.119.14/3010.0.119.16/28拨号池拨号池MDCNE0E1集团网管中心集团网管中心某省中心局点某省中心局点Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障二:IP专用承载网POS链路中断故障分析1.对对IP专用承载网的维护过程中,链路中断是较为经常出现专用承载网的维护过程中,链路中断是较为经常出现的故障现象。
引起链路中断的可能性有多种,需要具体问的故障现象引起链路中断的可能性有多种,需要具体问题具体分析题具体分析2.在发生链路中断的情况下,首先检查路由器端口状态,看在发生链路中断的情况下,首先检查路由器端口状态,看物理端口及物理端口及PPP协议是否协议是否UP如果物理端口如果物理端口down,说明,说明该路由器端口没有收到光信号,那么原因可能是接收光缆该路由器端口没有收到光信号,那么原因可能是接收光缆中断,或是对端传输设备端口没有正常发光导致综上所述中断,或是对端传输设备端口没有正常发光导致综上所述需要着重检查光路和传输侧设备需要着重检查光路和传输侧设备3.如果配置如果配置PPP协议的链路两端物理端口协议的链路两端物理端口UP,而协议不断,而协议不断在在up/down的状态,则有可能是两端的状态,则有可能是两端IP地址配置有问题地址配置有问题Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障二:光缆连接中断导致IP专用承载网链路中断 移动移动IP承载网承载网RT02-NE80E某局点某局点1TMG某局点某局点2TMG物理端口物理端口down (pos3/0/0)RT01-NE80E端口协议端口协议down (pos3/0/0)收不到光收不到光,发发R_LOS告警告警传输传输传输传输Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障三:链路能够ping通,但严重丢包 具体案例:具体案例: 某日,某省某日,某省AR1-AR2链路被发现严重丢包故障。
维护工程师通过检查发现该链路链路被发现严重丢包故障维护工程师通过检查发现该链路两端互连两端互连POS端口有大量端口有大量SDH错误,并不断增长错误,并不断增长对该段链路进行端口测试和传输测试对该段链路进行端口测试和传输测试,测试结果发现其中一端的,测试结果发现其中一端的POS端口接收的光功率过大(-端口接收的光功率过大(-2.5db)通过在)通过在ODF上增上增加光衰,端口的加光衰,端口的SDH错误包消失,传输上误码也消失,问题解决错误包消失,传输上误码也消失,问题解决 Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析典型故障三:链路能够ping通,但严重丢包 丢包率的相关定义:丢包率的相关定义: 对于丢包率的定义,一般通过对于丢包率的定义,一般通过ping对端设备进行连通性测试,测试的结果分为对端设备进行连通性测试,测试的结果分为4级:级:优良:丢包率优良:丢包率=0并且延迟小于并且延迟小于10ms正常:丢包率小于正常:丢包率小于2%或者时延或者时延< 100ms不正常:丢包率大于不正常:丢包率大于2%或者时延大于或者时延大于100ms中断:丢包率为中断:丢包率为100%其中,丢包率其中,丢包率=收到的响应包数目收到的响应包数目/发送的测试包总数发送的测试包总数Page HUAWEI TECHNOLOGIES CO., LTD.典型故障典型故障现象及案例分析象及案例分析导致链路质量不好的原因:l网络设备性能、配置问题:网络设备性能、配置问题: 路由器路由器/交换机交换机/服务器负载过重、配置不合理等服务器负载过重、配置不合理等 检查设备检查设备CPU利用率、内存使用率的情况来判断网络设备性能是否处在正常转利用率、内存使用率的情况来判断网络设备性能是否处在正常转发状态发状态 l物理链路质量引起:光纤物理链路质量引起:光纤/光模块光模块/光电设备光电设备/连接器等质量问题连接器等质量问题Ø通过通过tracert命令进行测试判断在哪个节点产生丢包和延时命令进行测试判断在哪个节点产生丢包和延时Ø查看设备端口统计情况查看设备端口统计情况 在接收端口通过在接收端口通过disp int <接口接口>命令查看端口计数,如果有大量命令查看端口计数,如果有大量CRC、、Error、、Fragment、、Jumbo等报文,则说明对端设备或者链路质量存在问题。
此时通过等报文,则说明对端设备或者链路质量存在问题此时通过同样的命令查看对端设备的输出统计信息,如果没有输出错误计数,则错包产生同样的命令查看对端设备的输出统计信息,如果没有输出错误计数,则错包产生于链路线缆或中间设备于链路线缆或中间设备Ø仪器测试仪器测试1.通过测试仪器可以进行链路误码测试、光功率、光衰减、线缆质量测试通过测试仪器可以进行链路误码测试、光功率、光衰减、线缆质量测试Page HUAWEI TECHNOLOGIES CO., LTD.Thank YPage 。
