
LTE核心网介绍与常见故障分析.ppt
28页LTE核心网介绍与常见故障分析广东公司网络管理中心2014年2月2提纲LTE核心网介绍LTE核心网全省网络现状LTE核心网语音方案CSFBLTE核心网维护省市分工LTE核心网故障和投诉典型案例介绍3LTE核心网介绍 – 拓扑ØMME:LTE接入下的控制面网元,负责移动性管理功能ØS4 SGSN:2G/3G接入下的控制面网元,相当于接入2G/3G的MME,进行移动性管理和会话管理ØS-GW:SAE网络用户面接入服务网关,相当于传统Gn SGSN的用户面功能ØP-GW:SAE网络的边界网关,提供承载控制、计费、地址分配和非3GPP接入等功能,相当于传统的GGSN除了2G/3G/LTE接入外,EPC同时支持WLAN/WiMax/CDMA等接入方式ØHSS:SAE网络用户数据管理网元,提供鉴权和签约等功能ØPCRF:策略控制服务器,根据用户特点和业务需求提供数据业务资源管控ØAF:业务策略提供点ØeNodeB:负责无线资源管理,集成了部分类似2G/TD基站和基站控制器的功能SGSN2GTDLTEHSSBTSBSC/PCUNodeBRNCeNodeBS1-US6aGxGbIuS1-MMES11SGiMMEPCRFS9InternetPS ServiceServing GWPDN GWS5/8SAE GWS6dS10BOSSCGS4S3AFRx终端E-UTRANEPCEPS4LTE核心网介绍 – 主要接口•S1-MME: E-UTRAN 和MME 间控制平面协议参考点•S1-U: E-UTRAN 和 S-GW间每个承载的用户平面隧道参考点•S5: 提供S-GW 和P-GW之间用户平面隧道效应和隧道管理,只用于S-GW和P-GW属于同一个PLMN•S6a: 为鉴别确认用户接入EPS系统,在MME 和 HSS之间传输签约数据。
•Gx: 为PCRF和P-GW中的PCEF(Policy and Charging Enforcement Function)提供QoS准则和计费标准的传输•S10: MME间的接口,为MME和MME之间信息的传输•S11: 提供MME和S-GW之间的相关控制和移动性管理•SGi: P-GW和分组数据网络之间的接口分组数据网可以是外部公共或私人数据网,也可以是内部分组数据网,例如为IMS提供服务•Rx节点位于AF和PCRF之间,具体PCC部分描述5LTE核心网介绍 – 主要流程n Attach附着附着终端初始接入网络,此时接入的MME没有任何终端的上下文数据终端之前非法关机或者某些错误,此时终端有有效的临时用户标识(GUTI/P-TMSI),网络中的移动管理实体(MME/SGSN)有终端的上下文,当前接入的MME需要去之前的移动管理实体获取上下文,并且删除之前的无效承载和HSS的位置信息1.终端开机2.终端从无服务区回到有服务区3.开关飞行模式n TAU跟踪区更新跟踪区更新1.终端从2、3G网络移动到4G网络2.终端进入一个新的TA,其id不在TAI list中3.周期性跟踪区更新定时器超时4.RRC连接释放消息中原因值为“load re-balancing TAU required”5.终端的核心网能力发生变化,比如5s从关闭4G功能到打开4G功能6LTE核心网介绍 – 主要标识n GUTI在大多数终端和MME的交互信令中标识终端,由MME分配全球唯一临时标识(Globally Uniq终端 Temporary 终端 Identity),类似RAI+P-TMSI
终端在TAI list中的TA间移动的时候,不需要发起TAUtac-lb
业务区业务区MMEMMESAE-GW第一节点名称第一节点名称第二节点名称第二节点名称第一节点名称第一节点名称第二节点名称第二节点名称广州GZMME1201BErGZMME1301BErGZSAEGW1201BErGZSAEGW1301BEr佛山FOSMME701BEr FOSSAEGW604BErFOSSAEGW701BEr江门JIMMME501BEr JIMSAEGW501BEr 湛江ZHJMME201BEr ZHJSAEGW201BEr 深圳SZHMME101BEr SZHSAEGW101BErSZHSAEGW201BEr东莞DOGMME101BHw DOGSAEGW101BHwDOGSAEGW102BHw惠州HIZMME101BHw HIZSAEGW101BHw 汕头SHTMME101BHw SHTSAEGW101BHw 10LTE核心网全省网络现状LAN内组网拓扑 – 广州中兴EPC 11LTE核心网语音方案CSFB›当需要拨打或接收来电时,被触发回落到与LTE网络重叠的2G/3G网络电路域›当通话结束后重新接入LTE并继续之前的PS业务LTEGSM / 3GS1-Ue-UuAbis / IubS1-MMES11SGsA / IuCSBTSNodeBeNodeBMMEBSCRNCMMEMSSSGSNS3Gb /IuPSS4S&PGWNc /NbInternetSGiCSFBphoneA1.CSFB 终端终端 发起联合附着发起联合附着CombinedAttach (TA)2.MME 处理联合附着请求,然后处理联合附着请求,然后根据根据TA->LA 映射表,找到对应映射表,找到对应的的MSC,通过,通过SGs接口发起接口发起CS域域的的LAU位置区更新位置区更新Location Update (LA)3.3.终端在终端在MSC上上 处于处于CSFB附着状附着状态态12LTE核心网语音方案CSFB›当需要拨打或接收来电时,LTEGSM / 3GS1-Ue-UuAbis / IubUm / UuS1-MMES11SGsA / IuCSBTSNodeBeNodeBMMEBSCRNCMMEMSSSGSNS3Gb /IuPSS4S&PGWRATchangeNc /NbInternetSGiBA1..呼入来话,被叫用户目前处于呼入来话,被叫用户目前处于LTE的的CSFB附着状态,通过附着状态,通过SGS口寻呼口寻呼4.4.终端回落到终端回落到2G5.5.终端响应寻呼并建立终端响应寻呼并建立2G的通道的通道2.MME通过通过LTE网络寻呼并通网络寻呼并通知用户释放链路,离开知用户释放链路,离开LTE网网络进行络进行CSFB被叫被叫PagingPaging6.6.终端终端 reselects an LTE cell after call completion, time staying in GSM/WCDMA is implementation dependent 终端完成呼叫后终端完成呼叫后进行小区重选或者进行小区重选或者FR快速返回快速返回4G网络网络3.eNodeB 基基站要求终端释放链路资源,离开站要求终端释放链路资源,离开LTE网络,直接通过网络,直接通过RRC Connection Release消息下带的频点回到消息下带的频点回到2G。
Paging132G典型典型CS域呼叫建立流程域呼叫建立流程CSFB呼叫建立流程呼叫建立流程Cell changeRead SIPagePageExtended service req终端stReleasePage responsePagePagePage responseMSC终端GSMMSC终端MMEGSMPageLTEReleaseCall setupCall setup指示网络建立连接到终端,并发送释放指令,进行回落•CSFB 涉及更多的接口及信令流程,因此延长了呼叫建立时间比原比原2G呼叫时延额外增加呼叫时延额外增加 2.5秒秒LTE核心网语音方案CSFB14LTE核心网省市分工User planeControl plane省级DNSeNodeBS1-UGxS1-MMES11SGiMMEPCRFS9Serving GWPDN GWS5/8SAE GWPTN路由配置Ø省公司网管中心:省公司网管中心:ü EPC核心网元(MME/SAEGW/PCRF/CG/DNS)软件功能、配置、性能方面工作ü EPC核心网数通设备(交换机、防火墙、GOM交换机)软件功能、配置、性能方面工作üLTE基站业务割接方案审核üEPC核心网业务割接方案审核Ø市公司网管中心市公司网管中心üEPC核心网元(MME/SAEGW/PCRF/CG/DNS)硬件维护工作ü EPC核心网数通设备(交换机、防火墙、GOM交换机)硬件维护、配置、性能方面工作üEPC核心网元-MME涉及TA方面的配置:u包括对应SGS接口功能并对接POOL内CSFB的MSC u全省TA-LA映射关系,以及每个LAC对应的POOL内的2个MSCuPTN基站回程路由配置üEPC核心网元-SAEGW涉及TA方面的配置:PTN基站回程路由配置üEPC核心网元-DNS配置:4G的TAC解析记录üLTE基站业务割接方案定制ü核心网业务割接和调整申请,方案制定(需省公司审核)省公司市公司省公司市公司省公司市公司省公司省公司15LTE核心网常见投诉和典型案例介绍1,典型案例--临时方案用户预换卡不能使用2、3G业务故障现象: 临时方案的用户临时方案的用户,在更换USIM卡但未开通4G业务的情况下,在4G网络的覆盖下,用4G终端可能无法正常使用2,3G业务。
只能在4G上设置“2,3G only”,才能恢复正常使用故障分析: 临时方案的用户,在更换USIM卡但未开通4G业务的情况下,当前BOSS系统只是将用户的IMSI鉴权信息通过BOSS指令存储到中兴HSS,并未建立IMSI和MSISDN的关联,即未放号为签约用户的任何2、3G的分组域、电路域和4G业务的签约信息这种场景下HSS给MME返回DIAMETER_ERROR_USER_UNKNOWN的错误码,MME收到HSS的DIAMETER_ERROR_USER_UNKNOWN码后,给终端返回#8 “EPS services and non-EPS services not allowed”的NAS原因值终端收到“EPS services and non-EPS services not allowed”的NAS值后,不再尝试重新选网16LTE核心网常见投诉和典型案例介绍故障解决: 针对这种临时方案的用户,如果只更换USIM卡不签约4G业务,根据测试,MME给终端返回#7 “EPS services not allowed”的NAS值能够使终端较快地重选到2、3G网络。
根据协议中定义的映射规则,HSS需要给MME返回DIAMETER_ERROR_UNKNOWN_EPS_SUBSCRIPTION (5420) with Error Diagnostic of NO_GPRS_DATA_SUBSCRIBED的错误原因值,对应到中兴HSS上,需要BOSS在用户进行更换USIM卡时,不管用户签不签约4G业务时,都要向中兴HSS发送放号的BOSS指令,如果用户不签约4G业务,则通过设置4G-APN模板为0来关闭用户的4G功能启示:网络侧把问题归类后,通过NAS值反馈给终端,终端针对不同的NAS值会有不同的响应行为,在定位此类问题的时候,需要抓取信令,观察S1-MME接口上附着失败或者TAU失败的原因值17LTE核心网常见投诉和典型案例介绍2,典型案例--国际漫游用户漫入到广州MME下无法使用故障现象: 韩国、香港等国际漫游用户在广州中兴MME下无法附着使用4G业务,而国内用户在同一地点正常使用4G业务故障分析: 进行信令跟踪,发现国际漫游用户附着时,MME回了PDN connectivity reject,原因值为网络失败:18LTE核心网常见投诉和典型案例介绍故障分析: MME失败观察报TAC的DNS解析失败:19LTE核心网常见投诉和典型案例介绍SHOW DNSCACHE:APNNAME="tac-lbea.tac-hb24.tac.epc.mnc000.mcc460.3gppnetwork.org",MODULE=20;信息查询结果有效项数-----------------------------操作成功2-----------------------------记录数 1信息DNS服务器地址 次序优选标志服务正则表达式替换---------------------------------------------------------------------------------221.177.78.246100999ax-3gpp-sgw:x-s5-gtptopoff.sgw-s5.sgw30.node.epc.mnc000.mcc460.3gppnetwork.org221.177.78.246300999ax-3gpp-mme:x-s10:x-gnmmec9d.mmegi0360.mme.epc.mnc000.mcc460.3gppnetwork.org---------------------------------------------------------------------------------记录数 2命令执行成功(耗时 0.094 秒)。
故障分析: MME上检查对TAC的域名解析缓存,发现只有x-s5-gtp服务,而国际漫游用户需要使用x-s8-gtp服务:20LTE核心网常见投诉和典型案例介绍故障解决: 在DNS上修改TAC域名解析数据,增加对X-S8-GTP的解析结果增加完毕后,再次检查MME上收到的DNS返回结果,发现支持X-X8-GTP,再次测试,国际漫游用户使用4G业务正常21LTE核心网常见投诉和典型案例介绍3,典型案例--过渡方案4G用户终端有4G信号但附着失败,驻留2,3G故障现象: 过渡方案4G用户终端有4G信号,但是附着失败,只能驻留在2、3G网络,更换位置后重新有4G标志,尝试附着仍然失败故障分析: 进行信令跟踪,发现用户在2、3G下无附着4G的请求上来,要求4G用户更换位置,能触发附着请求,查看信令发现拒绝原因值是#15 No Suitable Cells In tracking area,同时在中兴MME上抓包发现HSS返回的鉴权有错误,错误码是DIAMETER_AUTHORIZATION_REJECTED,检查HLR该用户签约数据,发现有2,3G签约,但4G被关闭(OBEPC-1),因此爱立信HSS返回DIAMETER_AUTHORIZATION_REJECTED,根据集团规范,MME会回复#15:No Suitable Cells In tracking area,导致终端不断重复4G附着,最后因失败该TA被终端记录下来作为不被允许的TA,不再尝试附着,但是更换了位置后,不同的TA下可以重新附着4G网络,但是因为HLR中停止了4G功能,附着4G网络仍然失败。
故障解决: 查看集团NAS值规范,针对4G被停机的情况,建议爱立信HSS返回UNKNOWN_EPS_SUBSCRIPTION,这样MME回复#7 EPS not allowed,只影响4G业务,不影响2,3G22LTE核心网常见投诉和典型案例介绍故障现象:故障现象: 在测试4G用户从中兴MME覆盖下切换到爱立信MME覆盖范围,发现4G用户切换失败,出现4G业务中断的情况故障分析:故障分析: 经过在MME侧抓包分析,从爱立信MME覆盖范围移动到中兴MME覆盖范围内,会由原MME发起Forward Relocation Request,并NAS层加密算法选定EEA2 0010 = Used NAS Cipher: 128-EEA2 (0x02) 但是在其后对中兴MME发起的TAU中,中兴MME发起了到HSS的鉴权请求,并选定000 .... = Type of ciphering algorithm: EPS encryption algorithm 128-EEA0 (ciphering not used) (0x00) EEA0作为加密算法,并向基站发起UE CONTEXT MODIFICATION REQEUST,要求基站修改NAS层加密算法,但是被基站拒绝。
究其原因,是因为爱立信基站不支持TAU过程中的UE上下文修改故障解决:故障解决: 通过爱立信MME的加密算法优先级,选定EEA0作为最高优先级,使得切换过程无需修改UE上下文,规避此问题,但是最终需要爱立信基站增强该部分功能 4,典型案例--爱立信MME到中兴MME切换出现4G业务断流23LTE核心网常见投诉和典型案例介绍5,典型案例--韶关CSFB呼叫失败原因故障现象: 韶关5s用户可以上4G进行数据业务,但是进行CSFB呼叫失败故障分析:经过MME以及MSC的联合调测发现,该用户在联合附着中,PS域附着成功,但CS域附着失败,初步怀疑是TA-LA映射表的MSC指向错误,核查该MSC pool中开了SGS口的MSC正确最后在SGS口抓取信令,发现原因是MME通过SGS口发向MSC的Location update的过程中,MSC拒绝了,因为MSC上配置的mme id是 mmec92.mmegi8365.mme.epc.mnc000.mcc460.3gppnetwork.org ,但MSC上配置的mme id是mmec92.mmegi0365.mme.epc.mnc000.mcc460.3gppnetwork.org ,因此MSC拒绝了CS域的附着请求。
故障解决:究其原因,是因为爱立信设备的一个限制,按照集团mmegi的规划,该台MME的mmegi应该是0365,但是实际由于爱立信设备的问题只能配置mmegi为8365,因此造成这个差别在MSC上按照mme id是 mmec92.mmegi8365.mme.epc.mnc000.mcc460.3gppnetwork.org 后,用户拨测用户拨测CSFBCSFB呼叫正常,呼叫正常,短信发送接收正常,问题解决短信发送接收正常,问题解决24LTE核心网常见投诉和典型案例介绍故障现象:故障现象: 阳江用IPHONE 5S在关闭4G功能的情况下附着在3G网络,正常发起业务,但是打开4G开关,出现20多秒无服务,最后附着在3G,只能通过重启终端附着上4G 故障故障分析:分析: 5s关闭4G网络,PDP激活到GGSN(5s关闭4G网络后,终端不上报4G能力,SGSN的UE能力识别为非4G终端,引导选用到GGSN当5s开启4G网络,会发起combined TAU到MME,此时返回TAU reject,原因值为CC=17 (network failure);原因是MME上有PGW 选择的校验,发现SGSN回复的SGS CONTEXT RESPONSE消息中携带了GGSN的地址,包含在Private Extension部分。
终端收到#17的网络故障原因值后,会重复以上TAU过程5次,都被拒绝,所以就出现了 十几秒后重选回3G网络的现象只有重启,才能正常返回4G究其原因,苹果5s的关闭4G功能,不上报终端4G能力,导致网络侧没有正常引导业务到PGW上,导致互操作失败故障解决:故障解决: 通过关闭SGSN的Private Extension消息体的回复,规避MME的PGW校验,使得TAU流程能在MME继续进行,最后因为创建承载失败而TAU拒绝,此时返回的NAS原因值不再是#17,因此苹果5s可以重新发起一次附着,从而返回4G网络6,典型案例--阳江公司5s用户开启257,典型案例--排除用户原因的附着成功率低LTE核心网常见投诉和典型案例介绍故障现象:故障现象: 某天全省的排除用户原因的附着成功率从90%以上,下降到60%左右 故障故障分析:分析: 从该指标的算法看,排除用户原因的附着成功率= EPS附着成功次数 / (EPS附着请求次数 -非法用户的EPS附着失败次数 -非法ME的EPS附着失败次数 -EPS服务不允许的EPS附着失败次数 -EPS和非EPS服务不允许的EPS附着失败次数),也就是附着请求次数 - #3 - #6 - #7 - #8的错误请求(减去属于用户原因部分),但是通过厂家网管查看15分钟颗粒度性能指标发现,在某个时刻开始,#15的错误请求次数增加明显,询问发现市场部推行用户开户模板默认关闭4G功能,导致全省大量用户出现4G停机现象, 2、3G正常的情况下,HSS返回DIAMETER_AUTHORIZATION_REJECTED (5003),MME将其映射的NAS原因值为#15:No Suitable Cells In tracking area;从而影响了排除用户原因的附着成功率。
故障解决:故障解决: 可知,上述原因是用户停机原因导致,因此对于NAS值#15的返回值,实际上包含部分用户原因的问题在里面,向集团反映该问题得知,目前的确存在这样的情况只能通过厂家MME上的NAS值映射功能,把这种HSS错误映射到其他原因值,从而在不影响用户感知的情况下,保证指标的客观准确性26LTE核心网常见投诉和典型案例介绍常见投诉处理--无4G信号 目前最常见的投诉是用户反馈4G无信号或不能使用4G业务 首先确认故障的范围,是个别用户问题、还是号段用户都有问题、还是一大片区域都存着此故障个别用户问题的尝试解决办法:1)可以先在HSS上查询该用户的签约数据是否正常2)通过MME/SGW/PGW/HSS信令跟踪来确定具体原因如果MME上跟踪不到任何S1口信令,一般是由于终端或USIM卡原因造出如果MME上跟踪到了用户信令,需要查看各接口的信令来确定具体原因,比如有可能是用户鉴权流程中失败、用户使用了非法的APN等TIPS:信令跟踪时建议通过IMSI来跟踪用户以便跟踪较全的信令3)如果不方便进行用户信令跟踪,可在HSS/MME上查看用户信息来进行简单判断下图为中兴HSS查看用户EPC位置信息方法,如果能查到MME信息,说明至少用户曾经在4G网络成功附着过,现在不能使用的原因有待进一步分析,如果没有MME位置信息,说明用户可能从未在4G网络附着过。
27LTE核心网常见投诉和典型案例介绍谢谢!。
