苹果iPad造成PS域掉话的分析
作者: 韩永涛 王瑞 简君文
(1 中国联通福建分公司网优中心, 厦门 361008;
2 中兴通讯公司,深圳 518057)
摘要 在同时连接WiFi和3G的情况下,苹果iPad会在3G无线侧出现每30s一次的掉话,严重影响网络KPI指标PS 域掉话率。本文介绍了该问题的分析过程以及解决方案,为后续系统与各种终端兼容性研究提供了宝贵的经验。
关键词 APN;iPad版本;“通知”功能;PDP去激活
中图分类号 TN929.5 文献标识码 A 文章编号 1008-5599(2011)07-0062-06
1问题的由来
[attach]927[/attach]
表1 iPad组合测试
[attach]928[/attach]
表2 对比测试
用深圳和某市的SIM卡在某市的网络下,分别向百度做路由trace,可以看出,深圳的SIM卡即使漫游到了某市的网络下,出局路由依然是在深圳的GGSN那边。这也是为什么深圳的SIM卡在配置了空白的APN后,依然可以上网的原因。得出结论:因为空白的APN导致某市的SIM卡无法直接浏览网页,无法满足iPad内部的一些软件的访问因特网需求,所以iPad不断发起业务请求,触发PDP激活去激活场景,目的就是希望能够接入,所以CN(SGSN)的APN策略也是影响某市iPad掉话的要因之一。
3.6iPad版本3.2(7B367)在PDP激活去激活的间隔上的问题
将新版本iPad带到某市对比旧版iPad,新版iPad的PDP激活和去激活间隔时间比较长,一般都会等到CN下发Iu_Release_Cmd,释放掉连接之后才发起下一个PDP激活请求,所以就没有问题。旧版本的iPad掉话次数很多,它一般是第②步与第③步骤之间间隔不到200ms,导致IU还没来得及释放,iPad就抢到第③步,然后报UELOST掉话,而且从SGSN侧没有抓到用户数据,说明此时业务面是没有通的。怀疑正是因为配置了空白的APN导致实际无法访问Internet,所以SGSN这一直没有收到UE的分组,要是UE的分组到达了,也就会很快地激活。新版本的iPad没有掉话,它在某市网下也会不定期地发起PDP激活和去激活请求,但是它第③步来得比较晚,一般大于3s,所以CN能及时的将IU连接释放掉。旧版本iPad和新版本iPad配置正确的APN后,都不会发生①②③④这样的往返,怀疑数据面如果是通的,iPad就不会主动多次尝试业务发去激活和激活流程。XM是华为的RAN,中兴的SGSN,就没有报掉话的现象,但是从目前分析,掉话需要同时满足3个条件才会发生:空白的APN导致无法上网;iPad版本比较旧,PDP激活去激活间隔小;iPad开启了“通知”功能,会主动尝试业务请求。需要在XM进行对比测试,构造出iPad高频率的激活去激活场景,来复现掉话的现象,如果XM不掉话,则问题肯定出在RAN侧。
3.7 RAN侧是否有问题
XM与某市共用中兴的CN,但是RAN是华为的,用3.2版本的iPad,配置空白的APN,在XM也无法直接浏览Internet,并且在SGSN没有抓到用户分组,构造出了高频率的激活去激活场景,但是始终没有掉话。说明某市iPad掉话问题,还是与某市的RAN有关。经过与XM局方沟通,从局方工程师那里将XMRAN侧的码流全部拷贝出来。查看XM的信令流程,可以看出,3.2版本的iPad在这个网络下,激活—去激活—激活也是完全连着的,并且激活与去激活的间隔也是几百毫秒。(注:每一次PDP激活,伴随着RB_SETUP流程,而PDP去激活,伴随着RB_REL流程)。XM的信令:①PDP激活—②PDP去激活之后,CN没有下发Iu释放,再次PDP激活和去激活多次都成功。某市的信令中,iPad再次PDP激活成功后,会报RRCStatus,表示此时状态不对了;对比两个信令:在PDP去激活时,某市网络在RadioBearerRelease消息填下了如下字段,而XM没有:
radioBearerRelease.u.later_than_r3.criticalExtensions.u.criticalExtensions.u.r5.radioBearerRelease_r5.m.signallingConnectionRelIndicationPresent=1
radioBearerRelease.u.later_than_r3.criticalExtensions.u.criticalExtensions.u.r5.radioBearerRelease_r5.signallingConnectionRelIndication=ps_domain
从协议331解释看出,在PDP去激活的RadioBearerRelease消息中的字段signalingConnectionRel是释放PS域的信令连接,在处理完这条消息后PS域的信令连接被RNC释放了,UE也会removethesignalingconnection,并且告诉高层。是否UE对这条信元的理解有问题?下面再分析某市的iPad信令,在成功完成PDP激活—PDP去激活的流程后,再一次PDP激活的流程里,iPad收到了CN下发的downlinkDirectTransfer,是PDP激活接受,其中还是带了cnDomainIndentity=ps_domian这个字段。跟着400ms后,UE就报了RRCStatus,提示与接收到的状态不对,如下所示:TRRC_UL_DCCH_Message.message.u.rrcStatus.protocolErrorInformation.diagnosticsType.u.type1.u.messageNotCompatibleWithReceiverState.rrc_TransactionIdentifier=0
TRRC_UL_DCCH_Message.message.u.rrcStatus.protocolErrorInformation.diagnosticsType.u.type1.u.messageNotCompatibleWithReceiverState.receivedMessageType=downlinkDirectTransfer
再查看331协议里关于RRCStatus的描述,推断应该是UE觉得上一个DownlinkDirectTransfer中提到的PS域的信令连接已经没有了,所以会上报了RRCStatus,并且会认为这条下行直传有问题,提示Protocolerror,原因是Messagenotcompatiblewithreceiverstate。下面追溯一下关于这个信令连接的状态变化过程:第①个UE发的PDP激活请求之前有个servicerequest,里面有如下字段,提示PS域的信令连接请求TRRC_UL_DCCH_Message.message.u.initialDirectTransfer.v3a0NonCriticalExtensions.laterNonCriticalExtensions.v59CriticalExtensions.initialDirectTransfer_v590ext.establishmentCause=originatingHighPrioritySignalling。第②个UE发的PDP去激活后,RNC下发了signallingConnectionRel,将PS域的信令连接释放了。第③个UE发的PDP激活请求中面还是带了cn_DomainIdentity=ps_domain字段,但是此时PS域的信令连接已经释放了,iPad也没有发信令连接请求。signalingConnectionRelIndication这个信元是可选字段,并且XM网络也没有,所以需要对比测试下,不填写这个该信元看看效果。刚好深圳联通有两个RNC,一个RNC是V3.07版本的,包含了这个字段,另外一个RNC是V3.09版本的,不包含这个字段。所以将某市的3.2版本的iPad带到深圳,分别在V3.07和V3.09版本的RNC下通过手工修改iPad的APN的方式,来触发多次PDP激活PDP去激活PDP激活的场景,用于复现某市iPad掉话的环境。测试情况如下,证明3.07版本的RNC在PDP去激活的时候,不应该同时把PS域也释放掉。在3.09版本下,新旧版的iPad都能够正常地发起多次PDP激活—PDP去激活—PDP激活的流程,没掉话。在3.07版本下,旧版本的iPad复现了和某市一样反复①PDP激活—②PDP去激活—③PDP激活—④UELOST掉话的流程,而新版本的iPad每次PDP去激活后,都会等待CN释放IU连接,依然不会掉话。
PDP去激活时RNC下发的RadioBearerRelease中有signallingConnectionRelIndication=ps_domain这条信元,会将iPad的PS域信令连接释放,然而某市联通的旧版本iPad可能没有理解这个字段,在200ms后又发起PDP激活请求,CN这边也认为iPad只是PDP去激活了,PS域信令连接还留着,所以保留有iPad相关的MM上下文,所以第二次PDP激活会成功。但其实此刻iPad的PS域信令连接已经被释放了,并且也没有重新申请信令连接。所以iPad会报RRCStatus说明与网络的状态不一致,关闭上行功率,之后NodeB无法找到iPad,上报RadioLinkFailure,然后RNC主动释放IU连接,报UELOST,产生掉话。如果将signallingConnectionRelIndication=ps_domain这条信元去掉,即使iPad频繁地发起PDP激活去激活流程,也不会掉话。
3.8最终结论与解决方案
因为版本为3.2的iPad没有设置APN,所以CN适配到了不恰当的APN,导致无法直接浏览Web,该iPad就会在3G下频繁地发起PDP激活PDP去激活PDP激活的流程,来不断地尝试接入Web,并且PDP去激活后200ms以内就立刻发起PDP激活,间隔很短;并且某市V3.07版本的中兴RNC在PDP去激活时,会通过signallingConnectionRelIndication=ps_
domain这条信元将UE的PS域信令连接释放掉;并且旧版本的iPad在理解这条信元上有问题,依然立刻发起了第二次PDP激活,导致iPad与网络状态不一致。空白APN、打开通知功能、PDP激活去激活太频繁、PDP去激活后释放PS域,当且仅当这四种偶然纠缠在一起的时候,就会发生一次必然的PS域掉话。
方案1,中兴可以出一个RNC的补丁,删除RadioBearerRelease信令里的可选字段signallingConnectionRelIndication=ps_domain。方案2,可以在CN通过修改APN策略,让空的APN也能映射到HLR优选的APN,使得iPad内部的软件的Web请求能够满足,来减少PDP激活去激活次数,来规避掉话的问题。方案3,可以通知客户升级iPad。方案4,可以通知客户关闭通知功能。方案5,可以通知客户设置正确的APN。
4小结
我们要有效地将现场客户反馈的问题,透过现象看到问题本质,快速、准确定位和解决问题,提升客户满意度。事件的发生往往具有一定的偶然性,然而真相总是掩盖在一些看似毫无关联的现象背后,让人有着一种捕风捉影般的感觉。今后业务、网络与终端都越来越复杂,提高系统与不同终端兼容性的能力也越来越重要。
欢迎光临 51学通信技术论坛 (http://51xuetongxin.com/bbs/) | Powered by Discuz! X2 |