利用RRC重建比例定位异常终端
利用RRC重建比例定位异常终端(移动网感知质量提升及优化创新劳动竞赛)项目成员: 黄甦 保翀 申报单位:中国电信南通分公司创新类型: 移动网优化创新 申报日期: 2017年11月 摘 要随着覆盖不断提升,用户高速增长,聚焦用户感知成为4G网络精细运营的关键。当前FDD-LTE网络正经历从广覆盖向深度覆盖过渡,随着4G用户的不断增加,网络许多问题是由异常用户、异常终端导致的。重建比例是KPI的重要组成部分,是网络性能的直观体现,更是建立“更广、更深、更优”4G网络重要一环,因此重建比例的优化就显得尤为重要。随着4G网络的不断完善,4G终端如雨后春笋般出现在人们视线,4G终端的普及也使得更多的山寨产品出现。山寨产品因价格低廉、造型时尚美观、以假乱真等优点,少量用户会选择这类终端,从而导致诸多山寨4G终端涌入现网。而山寨4G终端因质量没有保障,内部元器件性能较差,对重建比例等指标有着重大影响,进而影响现网KPI指标,影响用户感知和电信品牌效应。关键字:重建比例、终端、KPI指标目 录一、项目概述4二、项目关键创新点4三、创新成果展示4四、成果简介54.1、问题描述54.2、问题分析54.2.1 告警和操作排查54.2.2 话统问题分析64.2.3 信令跟踪分析64.2.4 现象原因定位74.2.4.1 排除常规重建原因74.2.4.2 终端重建原因分析84.3、问题解决104.4、异常终端定位104.4.1异常终端TMSI抓取104.4.2用户IMSI转换114.4.3用户手机号提取114.4.4 异常终端机型定位12五、效益评估及成果价值12六、成果推广现状及推广前景13一、项目概述随着覆盖不断提升,用户高速增长,聚焦用户感知成为4G网络精细运营的关键。当前FDD-LTE网络正经历从广覆盖向深度覆盖过渡,随着4G用户的不断增加,网络中许多问题是由异常用户、异常终端导致的。4G终端如雨后春笋般出现在人们视线,4G终端的普及也使得更多的山寨产品出现。山寨产品因价格低廉、造型时尚美观、以假乱真等优点,少量用户会选择这类终端,从而导致诸多山寨4G终端涌入现网。目前4G详细话单提取较为繁琐,本文中的一些定位异常终端的方法思路可供借鉴。通过本文总结出定位异常终端的思路如下。成果运用: 通过分析信令发现是引起KPI指标原因是否是异常终端引起,进一步分析信令了解无线环境。4G网络定位异常终端,由综合调度平台查询用户的号码,对用户进行回访确定用户使用的终端类型。通过用户感知平台确定该用户是否为质差用户。二、项目关键创新点随着4G用户的不断增加,网络中许多问题是由异常用户、异常终端导致的,本文创新的提出了两点定位异常终端的方法思路。 创新点1:通过分析信令发现异常终端引起RRC重建指标异常,分析UU口信令发现是引起RRC重建的原因是由异常终端引起的,进一步分析UU口信令排除了无线环境的原因;创新点2:运用用户感知平台分析异常用户,确定是否为质差用户,通过用户感知平台查询用户的终端信息和指标进而确定该用户是否为质差用户;创新点3:异常终端定位方法,确认终端机型,通过寻找异常终端的TMSI,通过网管查询用户的IMSI,最终定位异常终端机型。三、创新成果展示日常指标监控发现NTLBNUC新城_大学城1_4小区RRC重建比例指标存在异常,分析信令发现引起KPI指标原因由异常终端引起,进一步分析信令了解无线环境。通过4G网络定位异常终端,由综合调度平台查询用户的号码(需得到客户的书面授权)。通过用户手机号码回访用户,得知用户使用的手机为山寨Iphone 6S,操作系统为安卓系统,通过用户感知平台对IMSI查询用户的终端信息和指标进而确定该用户是否为质差用户。四、成果简介4.1、问题描述 通过日常指标监控发现NTLBNUC新城_大学城1_4小区在7月16日之后RRC重建比例指标存在异常,重建比例有时高达80%以上。日期小区名称RRC重建比例(%) RRC重建请求次数 RRC重建成功次数 切换失败触发RRC重建请求的次数 重配置失败触发RRC重建请求次数 2017/7/16NTLBNUC新城_大学城1_480.2850784797302017/7/17NTLBNUC新城_大学城1_479.24564056161602017/7/18NTLBNUC新城_大学城1_471.3210566105356802017/7/19NTLBNUC新城_大学城1_470.228979892722802017/7/20NTLBNUC新城_大学城1_479.9821553215119302017/7/21NTLBNUC新城_大学城1_474.2314255142375802017/7/22NTLBNUC新城_大学城1_458.9813150131236802017/7/23NTLBNUC新城_大学城1_480.712668126527902017/7/24NTLBNUC新城_大学城1_480.3389638942782 表4-1日常指标监控数据4.2、问题分析4.2.1 告警和操作排查 查询基站无相关告警信息,基站配置未出现错误,排除基站侧问题。 图4-1 基站告警排查4.2.2 话统问题分析 KPI指标分析:NTLBNUC新城_大学城1_4小区7月16日7月19日,每天的重建请求次数在8000此左右,7月20日的重建请求次数达到最大,在21000次左右,7月21日7月24日,每天的重建请求次数在11000左右;在7月16日7月24日之间,RRC重建请求次数波动较大,而重配置失败触发的RRC重建请求次数和切换失败触发的重建请求次数波动较平稳;由此可以得知该站点RRC重建比例较高和重配置失败、切换失败没有直接关系。 图4-2 KPI指标分析4.2.3 信令跟踪分析 通过对UU接口跟踪信令进行分析,发现RRC重建集中在某些TOP用户,统计比例如下表: CALL ID 计数项:Call ID 占比 127092 2942 28.84% 126767 1859 18.22% 126546 1390 13.63% 805439776 1 0.01% 总数 10201 100.00% 表4-2 UU接口跟踪信令 Top1用户的重建次数为2942次,占总数的28.84%,贡献了大多数重建。 而用户CallID总共有327个,重建次数在10次以上的CALL ID只有15个,因此占重建用户次数4.6%的用户贡献了96.19%的重建次数,可以确认为Top用户导致的问题。从信令跟踪来看,异常用户平均2s重建一次,反复重建导致指标恶化。4.2.4 现象原因定位4.2.4.1 排除常规重建原因通过分析UU口信令发现,同一TOP终端反复重建,重建原因值为otherFailure,如下图示: 图4-3排除常规重建原因通常引起原因值为“otherFailure”的机制有以下三种: 1)MAC层SRI重传达到最大次数 ,导致重建;2)上行RLC重传达到最大次数 ,导致重建;3)UE检测到下行无线链路失败 ,导致重建。从呼叫日志上分析来看: 1)SR无重传,排除MAC层SRI重传达到最大次数 导致的重建。2)终端在该段时间无数据发送,终端最后一次发起SR到终端发起重建的时间相隔700800ms,而RLC重传达到最大次数需要1.6s,发起重建的时间短于达到上行RLC重传达到最大次数时间,可排除终端上行RLC重传达到最大次数导致的重建。 3)从日志中来看,下行调度一直可以得到终端的反馈,因此排除UE监测到下行无线链路失败导致的重建。因此,排除通常引起重建的三种原因。4.2.4.2 终端重建原因分析通过分析CELLDT Trace,发现终端在重建之前,基站给终端下发的CQI上报模式为非周期CQI_Only,但UE没有在eNB要求的CQI Only时刻上报CQI,此后终端开始周期CQI上报,周期为20ms,因此怀疑终端试图通过发起RRC连接重建恢复其周期CQI上报。 CQI周期与非周期上报:CQI上报分为周期上报和非周期上报,周期CQI在PUCCH上报, 但由于上行的单载波特性要求, 当UE有数据在PUSCH上传送时, 周期CQI会随数据一起在PUSCH上传送;非周期CQI在PUSCH上报,当DCI0中CQI request置1时, UE上报非周期CQI。 CQI Only调度原则,在上报非周期CQI时,如果此时有上行数据传输, 则属于随路CQI,与数据一起传送;如果没有上行数据传送则CQI_Only传送,即UE在PUSCH只上报CQI. CQI_Only具有调度优势: 1) 保证CQI的实时性,在周期CQI上报不及时,为了更好的适配网络信道质量变化,触发非周期CQI来继续上报CQI,而当没有上行数传时,就会触发CQI ONLY来获取最新CQI,这样基站可以获取较新的CQI保证下行调度选择MCS的准确性; 2)CQI_Only是在UE没有上行数据时发送的并且没有重传,不会造成UL吞吐量的下降,CQI_Only调度不会影响DRX状态.如果关闭该功能,导致基站不能及时获取下行信道质量,影响下行吞吐量。 分两步进行终端CQI上报模式改变分析: 1) 基站下发CQI_Only调度的原因,整个过程简述:周期CQI->原因1变成非周期CQI-> 原因2变成CQI only。 原因1:DRX周期>5*N+1 原因2:UE此时没有UL数据发送,只发CQI 如下图所示: 终端在进入DRX之前为周期CQI上报,周期为20ms; 终端进入DRX状态(DRX长周期160ms,集团参数),其CQI周期拉长为160ms; 由于基站在5*N+1(N为CQI上报周期)时间内没有收到有效的CQI上报,触发非周期CQI。 图4-4 非周期CQI算法之所以约束“在5*N+1这段时间内没有CQI上报,就会触发非周期CQI”,是为了保证CQI的时效性,如果周期CQI上报不及时,为了更好的适配网络信道质量变化,触发非周期CQI来继续上报CQI。当前版本,CQI默认上报周期是20ms,则5*N+1=101ms,而DRX的长周期(LongDrxCycle)配置为160ms,而在DRX休眠期,终端是不能在PUCCH上报周期CQI的,因此终端CQI上报的周期拉长为160ms。160 > (5*N+1),基站在(5*N+1)的时间内无法收到有效的周期CQI上报,所以触发非周期CQI调度,而刚好UE此时没有上行数据发送,所以触发了CQI_Only。 2)通过基站和UE的行为分析