Inleiding
In dit document wordt beschreven hoe u problemen kunt oplossen met veelvoorkomende oorzaken van de ontoegankelijke serverfout die voor de meeste typen UCS-servers te zien is.
Voorwaarden
Vereisten
Cisco raadt u aan kennis te hebben van het beheer van servers in Unified Computing System Manager (UCSM) en Intersight Managed Mode (IMM).
Gebruikte componenten
Dit document is niet beperkt tot specifieke software- en hardware-versies.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
Er is een veel voorkomende fout die gebruikers kunnen ontvangen in hun UCS-domein en dat is om u te melden dat een server ontoegankelijk is. Dit kan om een aantal redenen zijn en de fout kan er op verschillende manieren uitzien, afhankelijk van monitoringtools en UCSM / IMM-versies.
System Notification from [UCSM Domain Name] - diagnostic:GOLD-minor - 2023-05-25 01:56:41 GMT-04:00 Recovered : Server x/y (service profile: org-root/ls-[service_profile]) inaccessible
Serial number: [Server Serial]
Alert: System Name: [UCSM Domain Name]
Time of Event:2022-08-31 03:15:04 GMT-05:00 Event Description:Server x (service profile: org-root/ls-[service_profile]) inaccessible Severity Level:4
Als IMM in gebruik is, is het bericht Verbinding met server is verloren mogelijk te zien in de GUI. Er kan ook worden waargenomen dat de verbinding met Intersight-fouten is verbroken.
De verbinding met de server is verbroken IMM
Deze waarschuwing is zichtbaar wanneer de Cisco Integrated Management Controller (CIMC) op een blade een probleem ondervindt en opnieuw opstart of probeert opnieuw op te starten. Hierdoor wordt een waarschuwing voor Server Inaccessible geactiveerd, omdat UCSM/IMM tijdens het opnieuw opstarten van het beheervlak van de blade niet met de blade kan communiceren, waardoor het denkt dat de blade ontoegankelijk is. Zodra de CIMC opnieuw is opgestart, wordt de status van de blades weer normaal.
Dit is de reden waarom u deze waarschuwing kunt ontvangen, en wanneer u het domein controleert, ziet de server er gezond uit.
gemeenschappelijke defectreferentie
Cisco bug ID CSCwe19822 - Van toepassing op M5/M6-servers na 4.2(2c)/na 5.0(1c) voor de X-reeks
Cisco bug ID CSCwa85667 - Van toepassing op M5/M6-servers tussen 4.1(3e) - 4.2(2a) Inclusief X-reeks na 5.0(1b)
Cisco bug ID CSCvz62711 - Van toepassing op M5/M6-servers tussen 4.1(3d) - 4.2(2a)
Cisco bug ID CSCwi50991 - Van toepassing op blades uit de M5/M6-reeks op code vóór 4.3(2e)
Cisco bug ID CSCvv79912 - Van toepassing op M5/M6-servers tussen 4.0(4h) en 4.2(1a)/4.1(3d)
Cisco bug ID CSCvh25786 - Van toepassing op M4/M5-servers na 2.0(13f) en 3.0(4a)
Probleemoplossing
Scenario 1
De eerste en meest voorkomende situatie is het ontvangen van de waarschuwing en bij het controleren van UCSM / IMM lijkt de server bedienbaar, gezond en zonder (nieuwe) fouten. Bij het controleren van het besturingssysteem lijkt het zonder onderbrekingen te zijn ingeschakeld.
Gezonde server in UCSM
Logbundels tonen dit bericht in een van de OBFL-logs die te vinden zijn op CIMCx_TechSupport.tar.gz > obfl > obfl-log.
3:2022 Sep 8 10:54:33 UTC:+0000:(4.2(2d)):kernel:-:[watchdog_init]:976:BMC Watchdog resetted BMC.
Dit vertelt ons dat CIMC op zichzelf crashte en opnieuw opstartte.
In dit scenario is geen verdere actie vereist omdat CIMC met succes opnieuw is opgestart en er geen problemen zijn met de server.
Scenario 2
De volgende situatie is het ontvangen van de waarschuwing en bij het controleren van UCSM / IMM wordt de server nog steeds als ontoegankelijk weergegeven als u UCSM gebruikt of de verbinding wordt verbroken als u IMM gebruikt. Bij het controleren van het besturingssysteem lijkt het zonder onderbrekingen te werken.
Aangezien het besturingssysteem actief is, maar UCSM/IMM niet met de blade kan communiceren, betekent dit dat CIMC niet opnieuw is opgestart of is vastgelopen in het proces.
De eerste stap in dit scenario is om SSH of Console te koppelen aan de Fabric Interconnects (FI) en deze opdracht uit te voeren om x/y te vervangen door het betreffende chassis/blade. Er zijn drie verschillende uitkomsten.
1) De verbinding met CIMC is succesvol.
UCSM-A# connect cimc x (For C Series Rack Mount Server)
UCSM-A# connect cimc x/y (For B/X Series Blade Server)
Trying 127.5.1.1...
Connected to 127.5.1.1.
Escape character is '^]'.
CIMC Debug Firmware Utility Shell [ support ]
[ help ]#
Als deze uitvoer wordt weergegeven, is er nog enige levensduur op CIMC en kunt u proberen CIMC opnieuw in te stellen om de blade te herstellen.
Als UCSM wordt gebruikt, gaat u naar Apparatuur > Chassis > Chassisnummer > Servers > Servernummer > Server herstellen > CIMC opnieuw instellen.
Locatie van Recover Server voor Blade
CIMC opnieuw instellen
Als IMM in gebruik is, navigeert u naar de betreffende server en selecteert u Acties > Systeem > Reboot Management Controller.
Reboot Management Controller IMM
Als de CIMC-server na het opnieuw opstarten weer normaal wordt, is het probleem opgelost en is er geen verdere actie vereist.
Als de fout blijft optreden, gaat u verder met de stappen voor probleemoplossing van de volgende verbinding met de cimc-uitgang.
2) Verbinding met CIMC mislukt.
UCSM-A# connect cimc x (For C Series Rack Mount Server)
UCSM-A# connect cimc x/y (For B/X Series Blade Server)
Trying 127.5.1.8...
telnet: Unable to connect to remote host: No route to host
3) Aansluiting op CIMC-kraampjes. In dit geval gebeurt er niets na het uitvoeren van het commando en bij het proberen te ontsnappen (Ctrl + C) wordt dit waargenomen.
UCSM-A# connect cimc x (For C Series Rack Mount Server)
UCSM-A# connect cimc x/y (For B/X Series Blade Server)
^C
Console escape. Commands are:
l go to line mode
c go to command mode
z suspend telnet
e exit telent
continuing...
De probleemoplossing voor een van de laatste twee uitgangen is hetzelfde. In deze gevallen is CIMC volledig down en niet in staat om te communiceren met de Fabric Interconnects. De server moet opnieuw worden opgestart om CIMC te herstellen. Het wordt altijd aanbevolen om een onderhoudsvenster te gebruiken bij het opnieuw opstarten van blades.
Als UCSM in gebruik is, kunt u het fysiek herstellen van de blade simuleren door SSHing naar de verbindingslijnen te sturen en deze opdracht uit te voeren door x/y te vervangen door het betreffende chassis/server. Het is noodzakelijk dat u het juiste chassis/de juiste server invoert, omdat u met deze opdracht niet om bevestiging wordt gevraagd.
UCSM-A# reset slot x/y
Opmerking: met de opdracht Sleuf resetten wordt de blade in de toegewezen sleuf x/y onmiddellijk opnieuw opgestart. Zorg ervoor dat de server veilig opnieuw kan worden opgestart als het besturingssysteem nog steeds actief is.
Dit commando geeft niets terug als het gelukt is. Als de opdracht niet wordt uitgevoerd, wordt een bericht weergegeven.
Als IMM in gebruik is of de opdracht Sleuf resetten het ontoegankelijke probleem niet heeft opgelost, is de enige andere optie het fysiek resetten van de blade.
Als na het fysiek herstellen van het mes, het probleem blijft contact opnemen met TAC voor verdere probleemoplossing.
Scenario 3
De uiteindelijke situatie is het ontvangen van de waarschuwing en bij het controleren van UCSM / IMM wordt de server nog steeds als ontoegankelijk weergegeven als u UCSM gebruikt of de verbinding wordt verbroken als u IMM gebruikt. Bij het controleren van het besturingssysteem, het is down en ook ontoegankelijk.
In deze situatie is het enige dat kan worden gedaan een reboot van de server. Als opnieuw opstarten niet mogelijk is, zet de server dan fysiek opnieuw op.
Als na het fysiek herstellen van het mes, het probleem blijft contact opnemen met TAC voor verdere probleemoplossing.
Conclusie
Er kunnen veel redenen zijn om Server Inaccessible-fouten te ontvangen, waarvan sommige meer impact hebben dan andere. De stappen hier zijn een goede plek om te beginnen om te beoordelen of probleemoplossing nodig is of dat uw domein gezond is en er geen actie nodig is.