51学通信技术论坛

标题: 求助:SGSN重启后到H局信令闪断 [打印本页]

作者: yonka    时间: 2012-1-11 13:19:05     标题: 求助:SGSN重启后到H局信令闪断

最近这边SGSN重启后,发现到华为的H局(HSTP2)的链路不正常,告警如下。


1958 ss7Mtpl3LkOutOfServ              2012-01-11 00:49:04 ss7M3 1.3                                                       major         equipment      59031958                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 1 is out of service. Status is 35.
1959 ss7Mtpl3LkUnavlForUP             2012-01-11 00:49:04 ss7M3 1.3                                                       major         communications 59031959                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 1 unavailable for User Part.
1960 ss7Mtpl3LkOutOfServ              2012-01-11 00:49:07 ss7M3 1.3                                                       major         equipment      59031960                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 17 is out of service. Status is 35.
1961 ss7Mtpl3LkUnavlForUP             2012-01-11 00:49:07 ss7M3 1.3                                                       major         communications 59031961                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 17 unavailable for User Part.
1962 ss7Mtpl3LkOutOfServ              2012-01-11 00:49:10 ss7M3 1.3                                                       major         equipment      59031962                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 16 is out of service. Status is 35.
1963 ss7Mtpl3LkUnavlForUP             2012-01-11 00:49:10 ss7M3 1.3                                                       major         communications 59031963                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 16 unavailable for User Part.
1964 ss7Mtpl3LkOutOfServ              2012-01-11 00:49:10 ss7M3 1.3                                                       major         equipment      59031964                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 2 is out of service. Status is 35.
1965 ss7Mtpl3LkUnavlForUP             2012-01-11 00:49:10 ss7M3 1.3                                                       major         communications 59031965                                                    Signaling link on EqPos 1.3, Trunk D and Timeslot 2 unavailable for User Part.
1967 ss7Mtpl3LkOutOfServ              2012-01-11 00:49:14 ss7M3 1.5                                                       major         equipment      59031967                                                    Signaling link on EqPos 1.5, Trunk D and Timeslot 17 is out of service. Status is 35.
1968 ss7Mtpl3LkUnavlForUP             2012-01-11 00:49:14 ss7M3 1.5                                                       major         communications 59031968                                                    Signaling link on EqPos 1.5, Trunk D and Timeslot 17 unavailable for User Part.


SS7状态如下:
SS7_MTPL3_LINK_NB Status
--------------------------------------------------------------------------------
net  nid OPC      lsid SLC eqp trk  ts      DPC       Name     SSN  Status      
--------------------------------------------------------------------------------
CORE 0   xxxx 10   0   1.3 B    1       xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   1   1.3 B    16      xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   2   1.5 B    1       xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   3   1.5 B    16      xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   4   1.3 B    2       xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   5   1.3 B    17      xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   6   1.5 B    2       xxxx  HSTP1    0    In Service
CORE 0   xxxx 10   7   1.5 B    17      xxxx  HSTP1    0    In Service
CORE 0   xxxx 20   0   1.3 D    1       xxxx  HSTP2    0    In Service
CORE 0   xxxx 20   1   1.3 D    16      xxxx  HSTP2    0    Aligning M3 links
CORE 0   xxxx 20   2   1.5 D    1       xxxx  HSTP2    0    Aligning M3 links
CORE 0   xxxx 20   3   1.5 D    16      xxxx  HSTP2    0    In Service
CORE 0   xxxx 20   4   1.3 D    2       xxxx  HSTP2    0    Aligning M3 links
CORE 0   xxxx 20   5   1.3 D    17      xxxx  HSTP2    0    Aligning M3 links
CORE 0   xxxx 20   6   1.5 D    2       xxxx  HSTP2    0    Aligning M3 links
CORE 0   xxxx 20   7   1.5 D    17      xxxx  HSTP2    0    Aligning M3 links

       现网配置是分号段分别平均的发向HSTP1(ASB)和HSTP2(华为),到贝尔的HSTP1每次都正常,到华为的HSTP2每次都会有异常。其中SGSN2和3一般十分钟后正常,SGSN4(MKVI,容量较大)则可能要半小时到两小时。
       目前华为的说法是重启后大量用户附着,Gr口信令负荷较高,爱立信的SGSN处理能力有限,部分流程未回应
       我们这边觉得这种说法不对,因为到贝尔的HSTP1完全正常。而对于这个华为的说法是贝尔的HSTP1上做了流量控制的策略,超出的流量往HSTP2上送。不过我觉得这个解释还是不准确,即使HSTP1把部分流量往HSTP2上送,影响的是HSTP2本身处理的流量,而跟SGSN本身的处理能力无关,在SGSN上看到是到HSTP1的链路正常而到HSTP2不正常。我觉得结论应该是HSTP2处理能力有限或者是HSTP1的策略不当导致HSTP2超负荷。

现在还在扯皮中,客户决定明晚挂表测,因为我对SS7流程还不是很了解,所以在这里问一下:
1、大家觉得华为的解释是否恰当?
2、挂表看信令流程时应该看那些部分来确定建立连接的流程中是哪边没有回应或者回应不当(不正确/超时)


作者: 爱卫生    时间: 2012-1-12 00:31:32

回复 yonka 的帖子

  个人感觉还是看证据说话吧。
  附着的时候Gr接口会有相应的消息,包括鉴权参数的获取,用户签约数据的请求,都是SGSN发给HLR的,如果确定SGSN已经发出去了,但HLR没有回。但同样的消息,从HSTP1回了,那就是华为的HSTP的问题了。

作者: yonka    时间: 2012-1-12 03:20:21

回复 爱卫生 的帖子

SS7_MTPL3_LINK_NB Status
要么是Aligning M3 links状态
或者First Attempt, ChangeBack状态
或者Wait for T17

MTPL3链路要达到in service状态需要完成什么样的协商过程吗?

今晚差不多40多分钟才完全正常,in service

作者: 弗里德姆    时间: 2012-1-19 22:54:38

事情最后有没有定位清楚呢?
作者: dandaner00hcw    时间: 2012-6-18 16:17:23

最后是什么情况啊
作者: yonka    时间: 2012-6-18 16:27:26

dandaner00hcw 发表于 2012-6-18 16:17
最后是什么情况啊

很扯皮的情况

Gr口流量变大时,华为H局处理消息变慢,从而对消息的证实也较慢(从抓包中可以看到)
最后导致爱立信SGSN侧T7超时

华为的说法是爱立信T7定时器定的过短

这个就很扯皮了
到底是处理过慢呢还是这边定时器设的过短呢

爱立信T7默认值是0.5
规范是0.5~2s似乎是






欢迎光临 51学通信技术论坛 (http://51xuetongxin.com/bbs/) Powered by Discuz! X2