Inleiding
In dit document wordt beschreven hoe u problemen met de Fabric- en Storage Card (FSC)-kaart kunt oplossen wanneer SNMP-trap "ThreshFabricEGQDiscards" wordt verwijderd.
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
Gebruikte componenten
Dit document is niet beperkt tot specifieke software- en hardware-versies.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Probleem
Fout "ThreshFabricEGQDiscards" wordt opgemerkt wanneer Single Event Upset (SEU) op de fabric edge (FE)-chipset op één FSC-kaart in een ASR5500-chassis wordt uitgevoerd. Door deze bit flip in FE tabellen, de FE chip begint te corrumperen pakketten (cellen) in de stof waardoor Egress Wachtrij Discards die leidt tot hartslag storingen tussen de kaarten.
U kunt een voorbeeld van dit probleem zien met de opdracht Command line interface (CLI) om de snmp-overvulgeschiedenis uitgebreid weer te geven.
Sat Jan 02 03:59:30 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 9 device 2 threshold 50 measured value 2430 interval 30
Sat Jan 02 03:59:30 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 9 device 1 threshold 50 measured value 2096 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 4 threshold 50 measured value 481 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 4 device 2 threshold 50 measured value 3761 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 4 device 1 threshold 50 measured value 3660 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 2 threshold 50 measured value 173 interval 30
Sat Jan 02 03:59:40 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 5 device 1 threshold 50 measured value 133 interval 30
Sat Jan 02 03:59:42 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 8 device 2 threshold 50 measured value 2977 interval 30
Sat Jan 02 03:59:42 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 8 device 1 threshold 50 measured value 4310 interval 30
Sat Jan 02 03:59:44 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 3 device 1 threshold 50 measured value 4499 interval 30
Sat Jan 02 03:59:44 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 3 device 2 threshold 50 measured value 4091 interval 30
Sat Jan 02 03:59:45 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 10 device 1 threshold 50 measured value 2796 interval 30
Sat Jan 02 03:59:45 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 10 device 2 threshold 50 measured value 5418 interval 30
Sat Jan 02 03:59:47 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 1 device 2 threshold 50 measured value 4747 interval 30
Sat Jan 02 03:59:47 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 1 device 1 threshold 50 measured value 5243 interval 30
Sat Jan 02 03:59:49 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 7 device 2 threshold 50 measured value 4644 interval 30
Sat Jan 02 03:59:49 2016 Internal trap notification 523 (ThreshFabricEGQDiscards) slot 7 device 1 threshold 50 measured value 5017 interval 30
Deze lijn is te zien onder meerdere kaarten cpu consoles:
Opmerking: foutopsporingskaart is verborgen/test-opdracht. Deze opdracht wordt ook elke keer verzameld voor alle kaarten op ASR5500 wanneer de opdracht Ondersteuningsdetails weergeven wordt uitgevoerd op de StarOs-node.
******** debug console card 1 cpu 0 tail 10000 only *******
Saturday January 02 05:45:38 EST 2016
[...]
2016-Jan-02+03:59:47.479 card 1-cpu0: afio [1/0/2701] [2862193.674] afio/afio_petrab_egress.c:121: #1: petrab=1=1/1, PetraB EGQ Egress drop threshold exceeded, drop count=5243, interval=30 secs, threshold=50
Problemen oplossen
Controleer of de uitloopdruppels toenemen.
Opmerking: Als de fabrieksfouten toenemen en u de StarOs-node uitvoert op versie 19.0 of hoger, gaat u naar de sectie Oplossing in dit artikel.
Opmerking: Als de fabrieksfouten toenemen en u de StarOs-knooppuntversie onder versie release.19.0 uitvoert, verhoogt u het serviceverzoek naar TAC.
Stap 1. Voer de testmodus in, hier is documentatie over hoe u deze kunt inschakelen op de StarOs-node.
cli test-commands [encrypted] password password
Stap 2. Controleer de gezondheid van de stof.
show fabric health | grep -i -E "^Petra-B|EGQ"
Voorbeeld van uitvoer wanneer het probleem niet aanwezig is:
[local]#show fabric health | grep -i -E "^Petra-B|EGQ"
Petra-B 1=1/1
Petra-B 2=1/2
Petra-B 3=2/1
Petra-B 4=2/2
Petra-B 5=3/1
Petra-B 6=3/2
[...]
Voorbeeld van uitvoer waarbij de hoeveelheid EGQ-weggooipakketten toeneemt:
[local]#show fabric health | grep -i -E "^Petra-B|EGQ"
Petra-B 1=1/1
EGQ.RqpDiscardPacketCounter 1143278
EGQ.EhpDiscardPacketCounter 1143278
EGQ.PqpDiscardUnicastPacketCounter 1143278
Petra-B 2=1/2
EGQ.RqpDiscardPacketCounter 1068491
EGQ.EhpDiscardPacketCounter 1068491
EGQ.PqpDiscardUnicastPacketCounter 1068491
[local]#show fabric health | grep -i -E "^Petra-B|EGQ"
Petra-B 1=1/1
EGQ.RqpDiscardPacketCounter 1346022 <<<
EGQ.EhpDiscardPacketCounter 1346022 <<<
EGQ.PqpDiscardUnicastPacketCounter 1346022 <<<
Petra-B 2=1/2
EGQ.RqpDiscardPacketCounter 1271360 <<<
EGQ.EhpDiscardPacketCounter 1271360 <<<
EGQ.PqpDiscardUnicastPacketCounter 1271360 <<<
Oplossing
automatisch terugwinningsmechanisme
Soort gedragsverandering:
Nieuwe CLI-opdracht om de FSC-procedure voor automatisch herstel/resetten in te schakelen bij het detecteren van overmatige teruggooi van de fabric
Release geïntroduceerd:
19.0
Oud gedrag:
Handmatig herstelproces om FSC's te resetten.
Nieuw gedrag:
Nieuwe CLI-configuratiecommando's, controleer de documentatie:
Fabric fsc Auto-Recovery Schakel max-pogingen <X> in om deze functie in te schakelen.
max-pogingen is het aantal keren dat elke FSC wordt gereset. Standaard zijn max-pogingen onbeperkt.
Fabric FSC Auto-Recovery uitschakelen om deze functie uit te schakelen.
show afctrl fsc-auto-recovery geeft details weer over FSC-auto-recovery, inclusief apparaten die nog moeten worden gereset, het aantal resetten, maximale pogingen, de status van de drempelwaarde voor uitstappen en de geschiedenis van het automatisch herstel van FSC.
Waarschuwing: impact op klant: FSC FE-apparaten worden gereset en pakketten tijdens de vlucht gaan verloren.
Opmerking: alle waarden behalve de geschiedenis worden gerepliceerd wanneer de MIO mislukt.