
LTEeNodeBFDD基站S1断链告警故障分析和处理案例.docx
14页LTE eNodeB-FDD基站S1断链告警故障分析和处理案例问题描述(故障现象)某局LTE网管上新出现十几个基站有S1断链的告警,查看告警信息时发现,基站配置的两个MME地址中有一个地址是不通的,基站能正常建链,但都出现到同一MME地址不通而告S1断链问题原因分析查看告警附加信息,发现基站配置的两个MME地址中有一个地址是不通的,只有一个地址通,基站能正常建链,但由于绝大部分其他基站到2个MME的地址都是通的,排除MME故障原因导致,检查告警基站的配置数据也没有发现问题,于是怀疑烽火IPRAN数据是否做了修改问题解决方案1、通过告警信息初步判断故障原因可能是基站配置数据有过修改、其中一套MME故障、IPRAN传输数据有改动 2、通过查看全网基站告警排除MME故障原因导致,检查基站配置数据都正常 3、基本定位为IPRAN传输数据修改导致,沟通烽火IPRAN人员了解到,他们在对应的B设备上把网关做了修改,让做数据的人员检查发现网关修改错误导致到一套MME的地址不通,从而导致我们基站上告S1链路断的告警,烽火把对应网关修改后告警恢复总结及注意事项利用告警信息进行故障的初步定位,应用排除法逐一排查最终定位故障原因,沟通协调传输厂家完成故障处理。
LTE eNodeB-某地FDD基站搜星故障的分析处理问题描述(故障现象)某局FDD基站近期频繁出现“GNSS接收机搜星故障”告警,维护组立即进行深入分析 时钟同步是为了让基站和网络中的其他设备的时钟频率或者时间差异保持在允许的范围内,避免传输系统中收发信号定时的不准确导致传输性能的恶化 FDD基站同步是为了后续引起诸如eMBMS、eICIC、MBSFN等降低干扰的关键技术 问题原因分析故障截图如下: ① 由于开站后就出现故障,初步判断硬件问题,更换蘑菇头、跳线等,故障依旧 ② 勘察现场,基站所处位置地理条件糟糕,位于两座山之间的山谷内 ③ 经一段时间观察,发现由于地理条件影响,该基站受环境影响格外明显,一旦出现大雾天气或者云雨遮挡,便会搜星失败 问题解决方案 根据具体情况,制定种解决方案: 1)新建对时服务器 2)延长软跳,将蘑菇头移到较好位置 3)将该站BBU移到其他较好位置的站点,再通过拉远布站 4)更换精度更好的蘑菇头 由于以前CDMA的蘑菇头更为优质,可寻找替换,运营商根据实际情况以及成本原因考虑,采用方案④,更换好,故障消失,恢复正常运行 总结及注意事项 FDD基站同步是为了后续引起诸如eMBMS、eICIC、MBSFN等降低干扰的技术,一旦出现告警时,要及时进行分析和处理。
FDD-LTE网规网优-LTE站点有信号无速率问题案例分析 问题描述(故障现象) 接到用户投诉,反馈在章贡区东江源大道与赣州大道交汇处天网杆站点下,4G用户使用FDD LTE网络上网时,有4G信号无法上网情况;章贡区东江源大道与赣州大道交汇处天网杆站故障表现:小区状态正常,后台UE观察也有用户,但现场测试人员反馈章贡区东江源大道与赣州大道交汇处天网杆站点测试时有信号也无法上网,后台查询历史告警发现不时有“S1用户面路径不可用”告警 现场下载测试指标情况图: 问题原因分析 1. 核查网管参数 从接入参数、重选参数、切换、3G-4G互操作涉及参数进行核查对比,核查结果参数配置正确; 2. 依次复位RRU,BPL,CC板,告警依旧不时闪现 3. 检查配置数据,并与传输侧联系,分别将相关数据进行了重做,问题还是未解决 4. 安排工程人员上站点检查设备安装质量并更换新的光纤及光模块,还是未解决问题 5. 后台查询告警通知,发现“S1用户面路径状态更新通知”里不时上报“不可用; 对端IP地址:6.27.176.253;”, “不可用; 对端IP地址:6.27.180.253”,后台诊断测试里用该站点IP拼这两个用户面地址,丢包率为100%,因此判断该站点eNBId, CC板或IP存在问题。
问题解决方案 通过对故障问题的分析、排查、判断: 1. 先行更换eNBId,故障依旧 2. 更换CC板,故障依旧 3. 更换一个新的IP,数据下发生效后,告警通知内就不再有S1用户面路径状态更新通知上报,后台诊断测试里用该站点新IP拼这两个用户面地址,丢包0%告警消除,问题解决 总结及注意事项 此次故障经过数据排查,硬件更换,再进行数据排查,最后才定位故障点并解决问题,处理故障周期长,用户感知差,主要原因还是故障处理人员前期处理失误导致,前期做数据排查时就已经要求更换新的IP进行验证,但故障处理人员更换新的地址未生效,事后又未反馈,导致故障原因分析时将这一因素忽略过去,从而导致后面做了多方面的排查都未解决故障,后期故障处理要吸取相关教训 LTE网络全IP、扁平化的架构,使无线侧和传输侧、核心网侧联系的更加紧密,但对维护技能提出更高的要求,更换新的IP,此类故障问题故障点比较隐蔽且发现的手段较少,是需要我们在日常故障中去积累的经验,也需要日后重点去寻求发现问题的有效手段,为现有网络安全运行提供坚实的保障基础 ZXSDR BS8700-FDD LTE BS8700 RRU内部故障处理经验总结 问题原因分析 RRU“内部故障(198098467)”告警是所有因RRU内部原因导致的告警的统称。
告警描述虽为“内部故障”,但是该告警涉及的告警种类却有多种,通过“子码”来区分子码”在告警信息的“附件文本”中上报,目前版本下可分为以下几种类别: 告警描述 附加文本 附件文本_ 示例(红色标识为“子码”) 内部故障 初始化异常 初始化异常,或在初始化后的持续监控中发现设备内通讯链路异常、器件异常 -ANT1 严重 ;故障信息:20121;3;单板序列号:219031655895; 内部故障 电源类异常 电源类异常 TX轻微 ;故障信息:20021(269418496);单板序列号:219034113456;L eNBId:348267 内部故障 时钟类异常 时钟类异常 严重 ;故障信息:20016(268386304);单板序列号:219034003108;L eNBId:311317 内部故障 TX通道异常 TX通道异常 -ANT4 轻微 ;故障信息:20035;2853;0;单板序列号:219036696952;L eNBId:344792 问题解决方案 各类 “子码 ”告警处理经验如下: Ø “初始化异常”的处理方法: “初始化异常”的“子码”为“20121”,此类“子码”可以通过telnet到RRU,进入MGR进程,用命令BspCtrlPm 0,0下电复位,一般可以恢复正常,命令执行过程如下(命令只针对于R8862/R8862A,R8882直接reboot): ushell enter print mod ushell enter debug mod $$BspCtrlPm 0,0 [42] [ begin to excel fun:BspCtrlPm ] Connection closed by foreign host 如果命令下电复位无法解决,建议更换RRU。
Ø “电源类异常”的处理方法: “电源类异常”的“子码”为“20021”,含义为“功放的供电电压低于欠压告警门限”可以通过命令解决: telnet到RRU进入MGR进程,先执行BspSetPaVolt 0,28000,等待返回结果 如果结果为value = 0(0x0)再执行BspResetPaPower,一般恢复告警如果反馈的结果为value = -1(0xffffffff)则可以确定为RRU硬件问题,更换RRU解决 value = 0(0x0)的执行过程: ushell enter print mod ushell enter debug mod $$BspSetPaVolt 0,28000 $$ [42] [ begin to excel fun:BspSetPaVolt ] [42] value = 0(0x0) [ end to excel fun:BspSetPaVolt ] $$BspResetPaPower $$ [42] [ begin to excel fun:BspResetPaPower ] value = 0(0x0) [ end to excel fun:BspResetPaPower ] [42] Cfr Gain: -40, Fpga Cfg Gain Reg Val: 7823 value = -1(0xffffffff)的执行过程: ushell enter print mod ushell enter debug mod BspSetPaVolt 0,28000 $$ [42] [ begin to excel fun:BspSetPaVolt ] [42] ERROR!Set Volt 28000,Get Volt 78 [42] ERROR!Set Volt 28000,Get Volt 78 [42] ERROR!Set Volt 28000,Get Volt 39 value = -1(0xffffffff) [ end to excel fun:BspSetPaVolt ] R8882命令格式为BspSetPaVolt 0,16000,BspResetPaPower Ø “时钟类异常”的处理方法: “时钟类异常”的“子码”为“20016”,含义为“射频单板锁相环告警”原因为“RRU和BBU之间的光信号异常”或“RRU锁相环硬件故障”。
一般RRU锁相环硬件故障概率较小,请首先检查光模块是否损坏、光接头是否污浊、光功率是否满足要求,以下RRU、BPL命令可以帮忙排查问题: RRU侧命令 BspPrintSfpInfo 0 ----查看RRU光口0光功率 rdfpga 0x58 ----如果全0则正常,需要多执行几次看是否一直为0 BPL侧命令 BspPrintSfpInfo 0 ----查看BPL光口0光功率 BspPrintSfpInfo 1 ----查看BPL光口1光功率 BspPrintSfpInfo 2 ----查看BPL光口2光功率 BspGetFpgaReg 0x0494 ----查看BPL光口0光功率 BspGetFpgaReg 0x049c ----查看BPL光口1光功率 BspGetFpgaReg 0x04a4 ----查看BPL光口2光功率 Ø “TX通道异常”的处理方法: 根据不同“子码”进行如下处理: 子码:20035 告警含义:数模功率差额异常 告警原因:数字和模拟功率差超过6dB以上 处理建议: 1、 检查有无其他告警,如有光口告警 、功放电压异常等告警,则先处理其他告警; 2、 复位设备,如果复位后告警变成 「内部故障」(20091)告警,更换RRU; 子码:20091 告警含义:定标失败告警 告警原因:定标过程中遇到发射功率异常或者调节增益异常 处理建议: 1、 先查看有无电压异常告警,如有则先处理电压告警; 2、 复位设备,如果。












