本文摘自《电信科学》2013年02期。本文已上传到论坛城通网盘(http://gprshome.400gb.com)。本文直接下载地址为:http://www.400gb.com/file/19313978。
【作者】 何晓明; 贾曼; 刘志华;
【Author】 He Xiaoming1,Jia Man2,Liu Zhihua1(1.Guangdong Research Institute of China Telecom Co.,Ltd.,Guangzhou 510630,China; 2.China Telecom Corporation,Beijing 100032,China)
【机构】 中国电信股份有限公司广东研究院; 中国电信集团公司;
【摘要】 分析了小流量长在线业务对Ev-Do网络的影响,从终端、网络、业务平台3个方面给出专为小流量长在线业务而优化的解决方案,并提出了加强无线运行指标预警及流量疏导等应对策略。
【关键词】 即时通信; 物联网; 小流量长在线业务; Ev-Do;
1 引言
随着3G网络的日益完善及广泛覆盖,移动互联网业务进入发展的快车道,智能手机已成为人们生活的基本配置。预计到2012年底,中国电信的3G手机用户数将达到7000万左右,3G智能手机用户数将占新增手机用户数的 80%以上。移动互联网在满足人们随时随地接入互联网的便捷性要求的同时,更为重要的功能是为人们提供广泛多样的社交沟通方式,如手机QQ、手机微博等即时通信 (IM)类应用。
智能手机“永远在线(always-on)”的这种业务体验需求对3G网络带来了巨大的冲击。最典型的例子是2012年1月 25日发生的日本最大的移动运营商NTT DoCoblo大面积网络瘫痪事故,故障持续近5h,而这己经是DoCoMo在过去6个月中出现的第5次网络问题。美国AT&T、欧洲Orange等知名电信运营商近年来也都曾遭遇类似的网络瘫痪。
本文主要分析人们广泛使用的IM应用这类小流量长在线业务,对Ev-D。网络的影响。在对小流量长在线业务特征进行分析和现场试验的基础上,进一步梳理Ev-D。网络承载小流量长在线业务的实现机制,从终端、网络、业务平台各个环节提出专为小流量长在线业务而优化的解决方案。
2 小流量长在线业务特征
小流量长在线业务大体分为两类:人与人通信及机器与机器通信(MtoM )。目前,国内人与人通信的小流量长在线应用软件主要以QQ"微信、微博为代表。根据统计,校园学生中手机QQ和微信的渗透率达到70%以上,而普通用户中参与QQ应用的用户占比也达到30%左右;校园学生同时也是手机微博的主要使用群体,渗透率达到35%以上。M2M应用是一种典型的小流量长在线业务,发展势头良好,是未来小流量长在线业务的潜在增长点。这两类小流量长在线业务的共同特征是数据传输的流量较低,但占用过多的无线资源,导致无线资源的使用效率低;同时频繁的连接激活与释放产生大量的信令开销,使无线网络的信令负荷过重。小流量长在线业务特征可概括为以下几个方面。
(1)在线时间长
对于M2M应用,因不同业务的应用场景不同,业务在线时间也不尽相同,但总体在线时间较长。如在电力抄表应用中,电力公司为了实时了解电力抄表系统的工作状态,要求抄表终端24 h在线;环境监测系统也要求全天候上报监测点的温度和湿度情况;公交或出租车的车载终端GPS定位业务每天在线时长至少为10 h。在手机M2M应用中,虽然不同个体间存在使用习惯的差异性,但运营商普遍采用的按流量计费方式使得大多数用户的平均在线时间超过8 h。
(2)流量小
不同于上网下载这类大流量突发业务,大多数小流量 不同于上网下载这类大流量突发业务,大多数小流量长在线业务具有小流量突发特点,即每次连接传输的数据量都很小。根据现场测试数据,车载终端GPS定位业务每次连接的前、反向数据量为800-860 byte,前、反向速率均小于4.8 kbps;手机QQ每次连接的前、反向数据量为500-600 byte,前、反向速率大部分接近3 kbit/s。
(3)连接次数高
对于车载终端GPS定位业务,需要实时了解车辆的轨迹和行踪,可根据车速情况调整GPS数据发送频度,若按平均每分钟上报一次数据计算,每小时建立的空口连接数约为60次;对于手机QQ业务,消息的发送频次取决于应用场景,根据华为公司智能终端实验室得到的长期测试数据可以得出,QQ用户每小时建立的空口连接数平均约为80次。在主流的IM软件中,由于国内使用QQ应用的用户渗透率最高,如此频繁的空口连接和释放对无线网络是一个挑战。
(4)心跳周期短
为保持业务长时在线,大多数客户端软件都具有心跳机制,如较早版本的QQ客户端心跳周期为30 s。
(5)前、反向链路的占空比低
由于小流量长在线业务具有较强的间隙性传输数据的特点一个小的突发数据过后.要经过一个较长的时间间隔长在线业务具有小流量突发特点.即每次连接传输的数据的特点一个小的突发数据过后,要经过一个较长的时间间隔才传送下一个突发数据。因此.根据现场测试数据可以得出.
车载终端及手机IM应用大部分连接的占空比都低于20%。也就是说,终端在提供小流量长在线业务的时候,大部分时间处在休眠状态,只有小部分时间在发送或接收数据。
下面以QQ业务流程为例,说明消息在QQ客户端和QQ应用服务器之间的交互过程。QQ业务流程包括:客户端登录i退出、心跳消息的周期性发送、聊天消息和系统消息传递,如图i所示。QQ业务客户端在QQ服务器成功登录后,才能进行聊天消息和系统消息的传递。聊天消息由客户端发送到服务器,再由QQ服务器下发到目标客户端;系统消息包括好友的上i下线通知和系统推送通知如广告等,由QQ服务器端发起,发送到QQ客户端。
[attach]2655[/attach]
3 小流量长在线业务对Ev-Do网络的影响
3.1 现场试验
为了了解小流量长在线业务对Ev-Do网络的影响程度,笔者收集了大量己有的现网侧试数据,并在江苏、四川等省份进行了现场试验,测试拓扑如图2所示。现场试验中,连接分光器的外置DPI设备及后台分析系统主要用于采集分析移动互联网业务的流量组成、小流量长在线业务在整个移动互联网流量占比以及参与小流量长在线业务的用户占比情况。核心网分组域中PDSN通过内置DPI模块对下行的IP报文进行识别和标识,在A10连接中通过GRE头部扩展属性携带业务标识APP ID及业务QoS等级profile ID,并传递到无线侧的BSC/PCF (base station controller/packet control function,墓站控制器l分组控制功能)。无线网管内置呼叫话单统计(CDT)模块实现基于业务的无线资源占用统计和分析,CDT能够统计到每个连接的时长、前/反向流量以及业务属性。根据CDT统计数据,能够得到各种业务所产生的连接数、连接时长、流量情况。
[attach]2656[/attach]
现场试验结果发现,由IM应用产生的无线连接数占所有移动互联网业务连接数的30%左右,由IM应用产生的话务量占到所有移动互联网业务话务量的20%,但IM应用所产生的前、反向流量却不到全网整个流量的1%。换言之,IM这种小流量长在线应用占用了Ev-Do网络30%的信令负荷及20%的无线资源,但是由于按流量计费这种商业模式,使得IM应用只为电信运营商贡献了I%的业务收入。
3.2 对Ev-DO网络的影晌
到目前为止,中国电信还未发生因小流量长在线业务引起的大面积网络瘫痪现象,但是在部分高校、高密度写字楼等人群聚集的热点区域,收到大量的用户投诉,主要表现为接入网络困难、频繁掉线、上网速率慢,甚至打不开网页等。通过无线网管数据分析得到,这些热点基站的忙时连接成功率、无线掉线率、连接数、话务量、反向链路RoT (rise over thermal,扇区总功率与墓底噪声功率的比值)等指标偏离正常水平,但是忙时前l反向吞吐量、前向时隙占用率等指标并未表现异常,这表明这些问题基站并不是由于业务量过载引起的。笔者对高校学生进行调研后发现,学生普退喜欢使用QQI微信、微博这类IM业务,尤其在一天中的22:00-24:00时段使用最为集中。
在EvDO网络中,每载扇激活的用户数主要受前向MAClndex数量、反向CE数量以及反向RoT等参数的限制。前向MAClndex资源中,每载扇能用于业务信道的最大数是114个,考虑到软切换的需要,假设软切换因子为30%-40rk,则前向业务信道MACh,dex资源最大可用数为70-80个。再考虑30%的冗余(一部分用于控制信道分组),实际可用于用户终端的数量为50-60个。反向CE数目受信道板硬件资源(如芯片)的限制,一般可通过硬件升级等方式提供更多的CE资源。
另一个限制每载扇激活用户数的重要因素是反向ROT指标。基站根据R产来评估基站的干扰和负载情况。由于Ev-Do系统反向采用码分多址接入方式,所以反向干扰受限;反向RpT抬升,将造成a站反向覆盖的收窄,远点用户由于功率不足造成接入失败和掉话,从而影响用户感知。反向RpT值越高,意味着反向负荷越重。一个载扇下激活的用户数越多,反向干扰就越严重。现场测试数据发现,50部手机QQ主动通信时《每分钟发送一条消息),可将反向链路的底噪抬升3-5 dB,相当于消耗30%-70%的反向容量。这会严重影响其他用户的业务体验。
在校园区域,由于大量学生在同一时间段频繁使用QQ这类IM应用,容易形成聚集效应,过度占用无线资源,导致上述无线资源枯竭,网络性能急剧恶化,用户体验变差。
另一方面,IM消息的频繁发送引起空口连接的频繁激活与释放,产生大量的信令开销,加重了控制信道的信令负荷。当控制信道发生信令拥塞时,信令开始丢弃,更有甚者,当信令风暴引起大量突发的寻呼消息时,将使得BSC的信令处理能力严重过载,最终引起大面积网络瘫痪。
表1概括了小流量长在线业务对Ev-Do网络资源的影响。
[attach]2657[/attach]
4 小流量长在线业务优化
根据上述分析,小流量长在线业务对Ev-Do网络的影响主要表现为两个方面:
- 空口连接时间长,造成对无线资源的过度占用,而每连接内传输的数据量小.无线资源使用效率低;
-空口连接次数高,增加无线网络的信令负荷,容易引起信令风暴。
针对这些问题。本文从终端、网络及应用平台3个方面提出较为完整的端到端优化手段。
4.1调整休眠定时器
对于IM这类小流量长在线业务,由于消息的传输具有较强的间隙性,一个小的突发数据过后.要经过一个较长的时间间隔才传送下一个突发数据,表现为传输链路的占空比很低。若能在传送一个突发数据后立即释放空口连接,可大大减少这种小流量长在线业务对空口资源的占用时间。休眠定时器就是指终端和网络侧检侧到空口连接空闲时(没有数据传输),释放该连接所需等待的时间。通过减少小流量长在线业务的休眠定时器可降低使用这类业务的话务量水平。
休眠定时器设置得过长,会增加每次连接的空闲等待时间,反映在用户平均话务量的升高;休眠定时器设置得过短,虽然会降低话务量,但可能会引起连接次数的增加,产生更多的信令开销。因此,调整休眠定时器需要权衡话务量与信令负荷两者的关系.不适合在信令负荷较高的网络中实施。
本文中以休眠定时器的最短极限3s为例,定义小流量长在线业务的一个消息突发为一串间隔小于3s的连续收发数据分组,每个消息突发之间的间隔称为消息突发间隔。假定小流量长在线业务的所有消息突发间隔以90%以上的概率落在l0s之外,那么,休眠定时器调整为3s比调整为10 s时充其量会多产生10%k的连接数,但用户平均话务量却降为原来的一半以上,相应地,无线网络的传输效率将得到成倍的提升,这对于校园这种QQ应用密集的区域是相当有吸引力的。通过在分组域部署的内置或外置DPI对小流量长在线消息报文的时间间隔分布情况进行统计分析,可以为优化调整休眠定时器提供参考依据。
因此,调整终端和网络的休眠定时器作为小流量长在线应用优化的重要手段,可有效减少用户对空口资源的占用.降低每用户话务量,减少反向干扰,提升网络性能,接入更多用户。调整休眠定时器可普遍适用于高校区域这种大量用户使用小流量长在线业务的场景等。
4.2 调整手机客户端及应用服务器的消息发送方式
大多数手机IM客户端为了保持业务的长时间在线,都会周期性向应用服务器发送心跳消息,以维持PPP连接永不中断。每次心跳消息的发送都可能引起空口连接的激活与释放,心跳消息的发送周期越短,增加的连接次数越多,用户的平均话务量水平和信令开销也会相应增加。因此,在不中断PPP连接的条件下,最大限度地降低终端发送心跳消息的频度,可以有效减少空口连接的次数,提高无线资源利用率。如早期版本的QQ客户端心跳周期为30s。1h就会产生120次的心跳消息,最坏情况下因心跳消息可能会多产生120次的空口连接。由于现网中分组域PDSN与终端的PPP连接的空闲超时定时器通常配置为10~15min,而实际上.IM客户端的心跳周期只要小于PPP连接的空闲超时定时器时间就可以维持PPP连接不会中断。
IM应用服务器也会主动向IM客户端频繁推送大量消息,如在QQ或MSN应用中,服务器会实时更新好友的上下线通知及各种广告信息等内容,特别是“群’服务中一个用户发送的消息将会广播给“群’中的所有用户,IM客户端建立的“群”越多,接收到的广播消息量就越大。大量来自服务器的消息一方面加重了Ev-Do网络寻呼终端的寻呼量,另一方面也会因大幅增加的空口连接次数造成对无线资源的过度占用。现场测试中发现一个列有100个好友的QQ客户端差不多每隔30 s发生一次寻呼及空口连接的激活l释放过程。如果SP能调整IM应用服务器的消息推送方式,把除了聊天这类实时性要求较高消息外的其他消息先缓存起来,再以较长的时间周期批量推送给IM客户端,可以大大减少服务器推送消息的频次,相应减少信令量及对空口资源的占用。
4.3 无线网络优化方法
针对小流量长在线业务所产生的大量信令负荷,可通过改进Ev-Do网络的寻呼方式来加以缓解。
墓于业务的寻呼抑制技术就是网络侧根据发起寻呼的数据分组的业务类型,设置不同的寻呼丢弃门限,当同步消息达到缓存队列相应门限闽值时,开始丢弃对应业务类型的寻呼消息,以缓解控制信道的拥塞。如为Qchat业务的寻呼消息设置最高优先级,对应的寻呼丢弃负载门限为90%;为上网浏览、视频播放类较高价值业务的寻呼消息设置次高优先级,对应的寻呼丢弃负载门限为80%;为IM类低价值业务的寻呼消息设置对应的寻呼丢弃负载门限为60%;为攻击流量的寻呼消息设置为“总是丢弃”。
基于业务的寻呼优先级技术类似于上述寻呼抑制技术,不同优先级寻呼消息进入不同优先级寻呼队列,当控制信道发生拥塞时,较高优先级队列中的消息优先得到寻呼。
上述寻呼技术在信令过载时会丢弃大量的低优先级的寻呼消息,是以降低低优先级业务体验为代价来换取高优先级业务的体验保障。分层寻呼技术则是通过改变寻呼范围来降低墓站控制信道的拥塞程度,有3种不同层次的寻呼方式。
·第I层寻呼是指最近上报的有效激活集扇区寻呼,该级寻呼是对上次终端与基站发生消息交互时AT上报的RU(route update,路径更新消息)里包含的有效PN所在的BTS发送寻呼,也称为RU寻呼。当距上次终端与墓站侧的联系间隔t满足:t <RU有效时间门限时,使用第1层寻呼。
·第2层寻呼也称为邻区寻呼,该级寻呼是对上次终端与基站交互的接入小区的所有邻区所属的BTS寻呼。当距上次终端与荃站侧联系间隔,满足:RU有效时间<t<子网方式RU有效时间,使用第2层寻呼。
·第3层寻呼是子网十邻区寻呼方式。该级寻呼是对上次终端与基站发生消息交互时在接入小区所在的子网和接入小区邻区从属的BTS中发送寻呼。当距上次终端与基站侧联系间隔t满足:1>子网方式RU有效时间,使用第3层寻呼。
目前己有厂商的无线设备支持这种分层寻呼技术。
针对校园这种使用小流量长在线业务聚集的区域。载扇同时激活的并发连接数很高,通常会接近每载扇设定的接入用户数极限,加重了反向干扰,导致反向容量严重受限,影响上网浏览、视频等其他业务的体验。干扰消除技术可以消除用户间的干扰,提高信道的信噪比,降低终端的发送功率,接入更多的用户。干扰消除技术包括TIC(traffic interference cancellation,业务信道干扰消除)和PIC(pilot interference cancellation,导频干扰消除)功能,它是基于高通公司的信号调制解调芯片来实现的。实验室测试数据表明,干扰消除技术可以把Ev-Do反向容量提升60%以上.非常适合于小流量长在线业务使用密集的校园区域。
5 结束语
移动互联网的迅猛发展以及物联网的兴起.催生出越来越多的小流量长在线业务,对E%-Do网络的影响日益显现。电信运营商首先应加强无线指标的实时监控安全预警系统,一旦发现有相关无线运行指标偏离正常范围,到达设定的安全边界,就应立即启动无线网络保护措施,避免网络大面积瘫痪事件的发生。同时.需从终端、网络及业务平台3方面研究和试验可操作的端到端的优化方法,维持现有网络的可持续运营.保护Ev-Do网络大规模建设投资。
小流量长在线业务颇覆了传统业务的话务模型,基于CDMA的3G移动网络技术在标准定制中没有考虑到今天如此广泛使用的小流量长在线业务对无线业务信道资源和信令资源的过度占用问题。因此,除了做好终端、网络及业务平台各个环节的优化工作外,还需对数据流量进行合理疏导,进一步加大Wi-Fi网络的覆盖力度,提升Wi-Fi网络服务质量水平,加强CDMA网与WLAN、的协同,把更多的小流量长在线业务分离到WLAN,有效缓解Ev-Do网络的压力。
欢迎光临 51学通信技术论坛 (http://51xuetongxin.com/bbs/) | Powered by Discuz! X2 |