Inleiding
In dit document wordt een probleem beschreven dat zich voordoet op Cisco Multilayer Data Switch (MDS) 9000 Series Fibre Channel (FC)-poorten en wordt een oplossing voor het probleem geboden.
Probleem
Dit gebeurtenissenlogboek voor koppelingen wordt weergegeven:
*************** Port Config Link Events Log ***************
---- ------ ----- ----- ------
Time PortNo Speed Event Reason
---- ------ ----- ----- ------
...
Jul 28 00:46:39 2012 00670297 fc11/25 --- DOWN LR Rcvd B2B
Het bericht LR Rcvd B2B (of Link failure Link Reset failed nonempty recv queue) geeft aan dat het apparaat dat op de poort is aangesloten een Link Reset (LR) naar de MDS verzendt, maar dat de MDS niet reageert met een Link Reset Response (LRR) vanwege interne congestie op de poort. De poort heeft pakketten in de wachtrij die worden ontvangen van het aangesloten apparaat, maar de MDS kan ze niet leveren aan de juiste uitgang poort. Omdat ze nog steeds in de wachtrij staan bij de ingangspoort, kan de MDS geen LRR terugsturen en mislukt de koppeling.
Deze foutmeldingen gaan samen met het vorige gebeurtenissenlogboek:
%PORT-2-IF_DOWN_LINK_FAILURE: %$VSAN 93%$
Interface fc11/25 is down (Link failure)
%PORT-5-IF_DOWN_LINK_FAILURE: %$VSAN 100%$
Interface fc5/32 is down (Link failure Link Reset
failed nonempty recv queue)
Opmerking: Dit scenario wordt gegeven onder de veronderstelling dat het aantal bufferkredieten dat de MDS het FC-apparaat verleent drie is en dat de pakketten van het FC-apparaat worden overgeschakeld naar de uitgang FC-poort.
MDS
FC Port FC Port
(Egress) Arbiter (Ingress) FC device
-------- ------- --------- ---------
1) <------- FC packet 1
2) <--- Grant Request
3) Grant------------>
4) <---------------FC packet 1
5) R_Rdy--------> Tx B2B=3
6) <------- FC packet 2 Tx B2B=2
7) <---- Grant Request
8) <------- FC packet 3 Tx B2B=1
9) <---- Grant Request
10) <------- FC packet 4 Tx B2B=0
11) <---- Grant Request
12) Time lapses - Variable depending on attached HBA type
13) <--------Link Reset(LR)
14) Start 90ms "LR Rcvd B2B" timer
15) "LR Rcvd B2B" timer expires
16) <--------NOS-------->
verklaring
In dit gedeelte wordt de vorige uitvoer uitgelegd:
- Het FC-apparaat verzendt in een FC-pakket naar de ingangspoort, bestemd voor de uitgang.
- De MDS Ingress Line Card (LC)-poort bepaalt de bestemmingsindex (DI) en verzendt het subsidieverzoek naar de arbiter (Bellagio2) op de actieve toezichthouder.
- De arbiter stuurt een Grant terug naar de ingangspoort, die hem toestemming geeft om FC-pakket 1 via de XBAR naar de uitgang te verzenden.
- De ingress LC verzendt FC-pakket 1 via XBAR naar de uitgang poort. Hierdoor is de ingangsbuffer beschikbaar.
- De ingangspoort stuurt een R_RDY terug naar het FC-apparaat, dat het krediet aanvult.
Opmerking: De eerste vijf stappen zijn typisch wanneer er geen congestie is. Ga er op dit punt van uit dat de wachtrijen voor de uitgang-poort vol zijn en geen pakketten meer kunnen ontvangen.
- Het FC-apparaat verzendt FC-pakket 2 naar de ingangspoort, bestemd voor de uitgang.
- De MDS LC-poort bepaalt de DI en verzendt het subsidieverzoek naar de arbiter (Bellagio2) op de actieve toezichthouder.
- Het FC-apparaat verzendt FC-pakket 3 naar de ingangspoort, bestemd voor de uitgang.
- De MDS LC-poort bepaalt de DI en verzendt het subsidieverzoek naar de arbiter (Bellagio2) op de actieve toezichthouder.
- Het FC-apparaat verzendt FC-pakket 4 naar de ingangspoort, bestemd voor de uitgang.
- De MDS LC-poort bepaalt de DI en verzendt het subsidieverzoek naar de arbiter (Bellagio2) op de actieve toezichthouder.
- De tijd verstrijkt, wat varieert op basis van het aangesloten HBA-type.
- Na enige tijd bij Tx B2B=0 initieert het FC-apparaat Credit Loss Recovery en verzendt het een Link Reset (LR).
- Wanneer de ingangspoort de LR ontvangt, controleert deze de ingangsbuffers en bepaalt dat er ten minste één pakket in de wachtrij staat. Vervolgens start een 90 ms LR Rcvd B2B timer.
- Als de subsidies worden ontvangen en de drie FC-pakketten worden verzonden naar de uitgang, wordt de LR Rcvd B2B-timer geannuleerd en wordt een Link Reset Response (LRR) teruggestuurd naar het FC-apparaat. In dit geval blijft de uitgang echter overbelast en blijven de drie FC-pakketten in de wachtrij staan bij de ingangspoort. De LR Rcvd B2B-timer vervalt en een LRR wordt niet teruggestuurd naar het FC-apparaat.
- Zowel de ingangspoort als het FC-apparaat initiëren een verbindingsfout via verzending van een niet-operationele reeks.
Oplossing
Als de koppeling is mislukt met een LR Rcvd B2B of een Link-fout Link Reset mislukt niet-lege recv wachtrij bericht, dan is de poort die is mislukt niet de oorzaak van de slow-drain en werd alleen beïnvloed door de trage / vastgelopen poort. Voer de volgende stappen uit om de trage/vastzittende poort te identificeren die de verbindingsfout heeft veroorzaakt:
- Bepaal of er meer dan één link is die mislukt vanwege het eerder genoemde probleem. Als meer dan één link ongeveer tegelijkertijd uitvalt, kan het probleem zich voordoen omdat alle poorten proberen pakketten naar een gemeenschappelijke toegangspoort te verzenden.
- Controleer de VSAN-zoningdatabase om te zien met welke apparaten het aangrenzende FC-apparaat is gezoneerd. Deze toewijzen aan de uitgang E of lokale F-poorten. Als u wilt toewijzen aan uitgang E, gebruiken poorten de opdracht fspf internal route vsan <vsan> domain <dom>. Als u wilt toewijzen aan lokale F-poorten, gebruikt u de opdracht flogi database vsan <vsan> tonen. Als er meer dan één link mislukt met het LR Rcvd B2B-bericht, combineer dan de gevonden uitgang E of lokale F-poorten en controleer op overlappingen. Overlappingen zijn waarschijnlijk de oorzaak van trage/vastzittende poorten.
- Controleer de poorten in stap 2 voor aanwijzingen van slow-drain. Voorbeelden zijn:
- Kredietverlies (AK_FCP_CNTR_CREDIT_LOSS / FCP_SW_CNTR_CREDIT_LOSS)
- 100 ms Tx B2B Zero (AK_FCP_CNTR_TX_WT_AVG_B2B_ZERO / FCP_SW_CNTR_TX_WT_AVG_B2B_ZERO)
- Time-outteruggooi (AK_FCP_CNTR_LAF_TOTAL_TIMEOUT_FRAMES / THB_TMM_TOLB_TIMEOUT_DROP_CNT / F16_TMM_TOLB_TIMEOUT_DROP_CNT)
- Als u vaststelt dat de slowport een uitgang E-poort is, gaat u verder met het oplossen van problemen met slow-drain op de aangrenzende switch die wordt aangegeven door de next-hopinterface van de FSPF.
- Als u vaststelt dat de trage/vastzittende poort een FCIP-koppeling of poortkanaal is, controleert u de FCIP-koppelingen op tekenen van IP-hertransmissies of andere problemen, zoals verbindingsfouten. Voer de opdracht ips stats all in om te controleren op problemen.
Configuratieopties
Hier zijn twee mogelijke opties voor systeemconfiguratie:
Gerelateerde informatie