Introduction
Ce document décrit le problème et la solution liés aux liaisons de couche d'adaptation des utilisateurs de niveau 3 (M3UA) MTP (Message Transfer Part) qui passent à l'état encombré ou à l'état d'échec, après une panne réseau majeure ou une mise à niveau logicielle du routeur ASR (Aggregation Services Router) Cisco desservant GPRS (General Packet Radio Service) Service Node (SGSN). Cela se produit normalement dans les scénarios d'interopérabilité où le noeud ASR 5000 est connecté à des noeuds tiers tels que Home Location Register (HLR) ou Radio Access Network (RNC).
Problème
Le problème sous-jacent est que le SGSN ASR 5000 reçoit une faible taille de fenêtres d'annonce dans la couche SCTP (Stream Control Transmission Protocol) à partir du noeud homologue distant, du noeud STP (Signaling Transfer Point), du HLR ou du RNC. La faible taille de fenêtre peut être vue dans la commande de trace de capture de paquets, la commande show SCTP ou la commande de surveillance du protocole dans le SGSN. Dans la capture de paquets, vous pouvez voir la taille de fenêtre annoncée dans le message SACK SCTP avec une valeur égale à zéro ou proche de zéro. Lorsque cela se produit, le SGSN déclenche une alarme M3UA afin d'informer le noeud homologue de ne pas envoyer le paquet à partir de ce point de terminaison homologue. La liaison SCTP est alors bloquée ou présente un état encombré. Puisque SGSN envoie une taille de fenêtre normale, il continue de recevoir des données M3UA des noeuds homologues, mais ces paquets peuvent être abandonnés dans la file d'attente si le noeud homologue ne sort jamais de la congestion.
Séquence d'événements menant à une alarme M3UA dans SGSN
- SCTP envoie une indication de début de contrôle de flux à M3UA.
- SCTP envoie une indication d’arrêt de contrôle de flux à M3UA.
- M3UA définit l'indicateur d'encombrement actif pour l'association et commence à interroger régulièrement SCTP sur son état de contrôle de flux.
- Pendant qu'une association est en contrôle de flux, M3UA met en file d'attente les futures demandes de données pour cette association jusqu'à ce que QUEUE_SIZE soit atteinte. À ce stade, les messages futurs de l'association sont ignorés. M3UA propage les informations de congestion d'association aux homologues distants individuels qui font partie de l'association.
- M3UA efface l'indicateur d'encombrement de l'association et arrête l'interrogation du SCTP.
- M3UA transmet tout ce qui se trouve dans sa file d'attente d'encombrement pour cette association à SCTP.
Interruptions SGSN
Tue Feb 11 07:03:12 2014 Internal trap notification 1074
(M3UAPSPCongested) ss7-routing-domain-1 peer-server-1
peer-server-process-1 (point-code-13959424) congested
Tue Feb 11 07:03:12 2014 Internal trap notification 1056
(SS7PCCongested) ss7-routing-domain-1 point-code-13959424 congested
Tue Feb 11 07:03:13 2014 Internal trap notification 1075
(M3UAPSPCongestionCleared) ss7-routing-domain-1 peer-server-1
peer-server-process-1 (point-code-13959424) congestion cleared
Tue Feb 11 07:03:13 2014 Internal trap notification 1057
(SS7PCCongestionCleared) ss7-routing-domain-1 point-code-13959424 congestion cleared
Journal de suivi
Peer Server Id : 2 Peer Server Process Id: 1
Association State : ESTABLISHED
Flow Control Flag : TRUE
Peer INIT Tag : 17282
SGSN INIT Tag : 3011555404
Next TSN to Assign to
Outgoing Data Chunk : 324019883
Lowest cumulative TSN acknowledged : 324019882
Cumulative Peer TSN arrived from peer : 2204328608
Last Peer TSN sent in the SACK : 2204328607
Self RWND : 1048576 <- SGSN sends
this window size
Advertised RWND in received SACK : 32 <- peer sends
this window size
Peer RWND(estimated) : 32 <- Estimated window
also goes down which cause SGSN not able to send packets on wire
Retransmission counter : 0
Zero Window Probing Flag : FALSE
Last Tsn received during ZWnd Probing : 0
Bytes outstanding on all
addresses of this association : 0
Congestion Queue Length : 0
Ordered TSN assignment Waiting QLen : 7690
Unordered TSN assignment Waiting QLen : 0
Total number of GAP ACKs Transmitted : 2
Total number of GAP ACKs Received : 2037
Solution
Chaque fois que des pannes ou des encombrements surviennent en permanence sur les liaisons, cela indique que le noeud homologue ne traite pas la demande à temps en raison de demandes écrasantes provenant du SGSN, ou que le SGSN peut recevoir un nombre écrasant de demandes du réseau en raison d'une congestion du réseau ou d'un problème de réseau.
Une solution de contournement pour sortir de cette condition consiste à bloquer et débloquer les liaisons associées à cet encombrement ou à ce battement. Une autre méthode consiste à supprimer puis à réajouter l'instance PSP (Peer Signaling Process) associée à cet encombrement ou à ce battement.
Informations connexes