Inleiding
In dit document wordt beschreven hoe u het controleprogramma voor de gezondheid en vóór de upgrade van Unified Computing System Manager (UCSM) uitvoert.
Voorwaarden
Vereisten
Cisco raadt u aan om Python 3.6 of hoger op het systeem te installeren.
Opmerking: Als u Windows OS gebruikt, kunt u Python laten installeren en het omgevingspad configureren.
Opmerking: Open geen TAC-case voor Python-problemen/script kan niet worden uitgevoerd. Raadpleeg het gedeelte CLI-opdrachten om het probleem handmatig te identificeren en TAC-gevallen per geïdentificeerd probleem te openen.
Gebruikte componenten
Dit document is niet beperkt tot specifieke software- en hardware-versies.
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
De UCSM Check Tool is een hulpmiddel om proactieve zelfcontroles uit te voeren op UCSM om de stabiliteit en veerkracht ervan te garanderen. Het helpt bij het automatiseren van een lijst met gezondheids- en pre-upgrade controles op UCS-systemen om tijd te besparen wanneer de UCS-infrastructuurupgrade en onderhoudswerkzaamheden plaatsvinden.
Let op: Download en gebruik altijd de nieuwste versie van de tool. Omdat de tool vaak wordt verbeterd, kan het belangrijke controles missen als u een oudere versie gebruikt.
Opmerking: Dit script is een best effort, gratis te gebruiken script. Het kan echter niet alle problemen identificeren.
Wanneer te gebruiken
- Voordat u UCS-infrastructuurupgrades uitvoert
- UCS Health Check voor en na onderhoudsactiviteit
- Werken bij Cisco TAC
- Proactieve gezondheidscontrole op elk moment
Hoe te gebruiken
Windows-besturingssysteem
Stap 1. Download de nieuwste versie van Python van Python Downloads
Stap 2. Gebruik het normale installatieproces en klik op Nu installeren (de aanbevolen) om de installatie te downloaden.
Opmerking: controleer Python toevoegen aan PATH.

Stap 3. Navigeer naar de directory waarin Python op het systeem is geïnstalleerd.
Stap 4. Open de opdrachtprompt en typ de opdracht Python om de installatie van Python te verifiëren.

Stap 5. Download hier de nieuwste versie van het gezondheidscontrolescript en sla het op in een map. Nu, pak het gecomprimeerde bestand, zoals weergegeven in de afbeelding.

Stap 6. Download en sla de nieuwste UCSM-logboeken voor technische ondersteuning op in de gemaakte map, zoals weergegeven in de afbeelding. Klik op deze link om de stappen te vinden om de UCSM-logbundel te downloaden: UCSM Technical Support genereren.
Stap 7. Open CMD en cd naar de map waarin UCSMTool.py zich bevindt en voer UCSMTool.py uit zoals in de afbeelding wordt weergegeven.

Stap 8. Voer het bestandspad in waar het UCSM-bestand voor technische ondersteuning zich bevindt en kies de gewenste optie.
1. UCSM-gezondheidscontrole
2. Pre-upgrade-controle

MacOS
Stap 1. MacOS wordt geleverd met standaard Python geïnstalleerd. Controleer de geïnstalleerde Python-versie zoals weergegeven:

Opmerking: Als de Python-versie lager is dan 3.6, upgrade dan naar 3.6 en latere versies.
Opmerking: Als de Python-versie 3.6 of hoger is, springt u naar stap 5, anders springt u naar stap 2.
Stap 2. Download de nieuwste versie van Python van Python Releases voor Macro's.
Stap 3. Gebruik het normale installatieproces om de installatie van Python te voltooien/upgraden.
Stap 4. Download hier de nieuwste versie van het gezondheidscontrolescript en sla het op in een map. Pak nu het gecomprimeerde bestand uit, zoals in deze afbeelding wordt weergegeven:

Stap 5. Download en sla de nieuwste UCSM-logboeken voor technische ondersteuning op in de gemaakte map, zoals weergegeven in deze afbeelding. Klik op de link om de stappen te vinden om de UCSM-logbundel te downloaden: UCSM Technical Support genereren.

Stap 6. Open de terminal, blader naar de directory waar u het controlescript hebt gedownload, voer python UCSMTool.py of python3UCSMTool.py uit zoals wordt weergegeven:.

Stap 7. Voer het bestandspad in waar het UCSM-bestand voor technische ondersteuning zich bevindt en kies de gewenste optie om het script uit te voeren.
1. UCSM-gezondheidscontrole
- Controle vóór upgrade

Uitgangen/uitgevoerde controles begrijpen
Controles uitgevoerd door UCSM HealthCheck
Deze controles worden uitgevoerd door UCSM-Healthchecktool:
- UCSM HA-clusterstatus: geeft de clusterstatus van de verbindingen weer.
- PMON-processtatus: geeft de status van alle processen in Cisco UCS Manager weer.
- File System Mount: hiermee wordt de koppeltabel weergegeven.
- Controleren op /var/ sysmgr size issue: Controleert /var/ sysmgr usages.
- Controleren op /var/ tmp size issue: Controleert of /var/ tmp gebruikt wordt.
- 6296 FI reageert niet meer na een stroomcyclus, update van de HW-revisie: controleert de verbindingsmodule van de verbinding en het HW-revisienummer.
- Fouten met een ernstige of kritieke ernst: Rapporten als u een belangrijke of kritieke waarschuwing hebt in UCS Manager.
- Beschikbare back-up controleren: controleert of back-up beschikbaar is in UCS Manager.
- Keyring Cert Check: Controleert of de keyring is verlopen of geldig is.
- Veilige oplossing nodig of niet: controleert of een veilige oplossing nodig is of niet door het FI-model en de versie ervan te controleren.
- Afgekeurde hardware in Cisco UCS Manager Release 4.x: Controleert op afgedankte hardware in Cisco UCS Manager 4.x Release.
- Afgeschreven hardware gevonden voor 3.1.x en verder: Controles voor afgeschreven hardware in Cisco UCS Manager 3.x Release.
- Controleren of B200M4 opnieuw wordt opgestart vanwege lege MRAID12G-velden: controleert of de B200M4-server een lege S/N of MRAID12G RAID-controller heeft.
- UCSM 3.1 Wijziging in de maximale stroomtoewijzing veroorzaakt fouten bij bladedetectie: hiermee wordt het in UCS-beheer geconfigureerde energiebeleid geverifieerd.
- Bestaan van bootflash-corruptiefoutcode F1219: Controleert het bestaan van bootflash-corruptie.
- Controleren of httpd niet kan worden gestart wanneer de standaardsleutel is verwijderd: Controleert of de standaardsleutel is verwijderd.
- 3rd GEN FIs heeft onreine bestandssysteemstatussen-"Bestandssysteemstatus: schoon met fouten": Controleert op fouten in het bestandssysteem.
- Controleren of server automatisch wordt geïnstalleerd op 4.0(4b) De SAS-controller kan niet worden geactiveerd: controleert de versie van de hostfirmware en de versie van de SAS Expander.
- Controleer of de firmware-upgrade van de C-reeks lang wordt uitgevoerd, voer een inventarisatie van de server uit, PNU OS Inventory: verifieert het servermodel en de versie ervan om te bepalen of dit probleem is opgetreden.
- Controleer het UCSM-verificatiedomein dat gebruikmaakt van een punt of koppelteken: verifieert of de domeinnaam voor verificatie is geconfigureerd met een punt of koppelteken.
- Lokale of fallback-verificatiefout: controleert of de verificatiemethode voor een bepaald FI-model is geconfigureerd en verifieert ook de versie ervan.
- Controle tussen UCSM en UCS central: Controleert of UCS Manager is geregistreerd bij UCS Central.
- Gereserveerde VLAN-controle: controleert of de gebruikte VLAN's zich binnen het gereserveerde VLAN-bereik bevinden.
- LAN- en SAN-pingroepen: controleert de configuratie van de LAN/SAN-pinning in uw cluster en markeert deze om uw configuratie te bekijken voordat u een upgrade uitvoert/een MW-activiteit uitvoert.
- Controleren van activiteiten in behandeling in UCSM: Controleert of er activiteiten in behandeling zijn in uw UCS Manager-domein.
- Health Check for IOM: Controleert de algehele gezondheid van de IO-modules.
- Core Files beschikbaar in UCSM Check: verifieert of een Core File is gevonden binnen 60 dagen.
- Disjoint L2 potentiële misconfiguratie: Controleert of er een misconfiguratie is in het geval Disjoint L2 is geconfigureerd.
- VIC 1400 en 6400 Link Flap probleem: Controles op voorwaarden aanwezig in dit defect.
- Controleer of 2304 IOM's de verbinding verbreken en opnieuw verbinden tijdens firmware-update: verifieert het model Fabric Interconnect en IO-module en identificeert of er mogelijk een probleem is.
- DME Health Check: verifieert de status van de database van de Data Management Engine (DME).
- Aantal interface-up en Flogi-matching op FI: verifieert het aantal interfaces en flogi-sessies.
- Jumbo of Standaard MTU Check: identificeert de MTU-configuratie.
Voorbeeld van uitvoernummer van UCSM-tool
akmalla@ucsm_health_check-master % python3 UCSMTool.py
UCS Health Check Tool 2.0
Enter the UCSM file path: /Users/akmalla/Desktop/UCSM health Script/UCSMlog.tar
Press 1 for UCSM Health Check
Press 2 for PreUpgrade Check
Enter your choice (1/2): 1
Log Extraction: [########################] COMPLETED
UCSM Version: 4.3(2c)
Summary Result:
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| SlNo | Name | Status | Comments |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 1 | UCSM HA Cluster State | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 2 | PMON Process State | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 3 | File System Mount | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 4 | Check for /var/sysmgr size issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 5 | Check for /var/tmp size issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 6 | 6296 FI unresponsive after power cycle, HW revision update | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 7 | Faults with Severity Major or Severity Critical | Found | Review the faults and Contact TAC, if needed |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 8 | Check Backup Available | Backup Operation Not Found | Backup operation has not been found. Please ensure that the |
| | | | latest backup is captured as a best practice. |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 9 | Keyring Cert Check | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 10 | Safeshut Workaround Needed or Not | Not Needed | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 11 | Deprecated Hardware in Cisco UCS Manager Release 4.x | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 12 | Deprecated HW found for 3.1.x onwards | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 13 | Check for B200M4 reboot due to blank MRAID12G fields | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 14 | UCSM 3.1 Change in max power allocation causes blade discovery | Not Found | |
| | failure | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 15 | Existence of bootflash corruption fault code F1219 | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 16 | Check for httpd fail to start when default keyring is deleted | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 17 | 3rd GEN FIs has unclean file system states-"Filesystem state: | Not Found | |
| | clean with errors" | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 18 | Check for Server Auto-Install to 4.0(4b) Fails to Activate SAS | Not Found | |
| | Controller | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 19 | Check for C-Series firmware upgrade stays long in process | Not Found | |
| | "perform inventory of server" PNU OS Inventory | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 20 | Check UCSM Authentication Domain using a Period or Hyphen | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 21 | Local or fallback Authentication failure | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 22 | Health check between UCSM and UCS central | Not Found | UCS Manager is Not Registered |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 23 | Reserved VLAN Check | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 24 | LAN and SAN Pin Groups | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 25 | Checking Pending Activities Present in UCSM | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 26 | Health Check for IOM | PASS | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 27 | Core Files available in UCSM Check | Not Found | No core files were found in last 60 days |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 28 | Disjoint L2 potential misconfiguration | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 29 | VIC 1400 and 6400 Link Flap Issue | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 30 | Check 2304 IOMs disconnect and re-connect during firmware update | Not Found | |
| | step | | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 31 | Number of Interface up and Flogi Matching on FI | --- | Primary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 7, |
| | | | Flogi Count: 0 |
| | | | Secondary: |
| | | | FC Port Trunking Count: 0, |
| | | | Eth up Port: 7, |
| | | | Flogi Count: 0 |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
| 32 | Jumbo or Standard MTU Check | Not Found | |
+------+-------------------------------------------------------------------+----------------------------+-------------------------------------------------------------------+
Faults with Severity Major:
F0331: Service profile DemoSP cannot be accessed
F0831: lan Member 1/2 of Port-Channel XXXX on fabric interconnect B is down, membership: down
F0858: lan port-channel XXXX on fabric interconnect B oper state: failed, reason: port-channel-members-down
F0831: lan Member 1/2 of Port-Channel XXXX on fabric interconnect A is down, membership: down
F0858: lan port-channel XXXX on fabric interconnect A oper state: failed, reason: port-channel-members-down
NOTE:
a. All reports and logs will be saved in the same location from where the script was executed.
b. Please visit the Summary Report/ Main Report to view all the Major and Critical Fault alerts.
Uitvoer van gereedschap analyseren - Volgende stappen
- De tool automatiseert het proces van het uitvoeren van handmatige opdrachten op UCS-systemen.
- Als de tool OK draait en PASS/NOT FOUND op alle tests geeft. Het UCS-systeem is goed voor alle controles die het script heeft uitgevoerd.
- In situaties waarin de tool FAIL/FOUND op sommige controles of niet met succes wordt uitgevoerd, kunt u de CLI-opdrachten (die hier worden vermeld) gebruiken om dezelfde controles uit te voeren op de UCS System/Fabric-interconnectie als handmatig door het script wordt uitgevoerd.
- De tool controleert NIET op oude/nieuwe/open/opgeloste kanttekeningen en daarom wordt het ten zeerste aanbevolen om UCS Release Notes en Upgrade Guides te bekijken voordat u een upgrade of onderhoudsactiviteit uitvoert.
Tip: Voor een algemene gezondheidscontrole van uw UCS-omgeving biedt Cisco TAC deze service niet aan. Cisco's CX Customer Delivery Team (voorheen bekend als Advanced Services) heeft een bug scrub / risicoanalyse die het aanbiedt. Als u dit type service nodig hebt, neemt u contact op met uw verkoop-/accountteam.
CLI-opdrachten
SSH voor beide verbindingslijnen:
# show cluster extended-state, verify HA status is ready.
# connect local-mgmt ; # show pmon state, Verify the services are in running status.
# connect nxos ; # show system internal flash, Verify free size in /var/sysmgr and /var/tmp
# connect nxos ; # show module, verify HW revision number for 6296 fabric interconnects.
# show fault detail | include F1219, verify this fault code for bootflash corruption
# scope eth-uplink; # show reserved-vlan
# show iom health status, displays health of IOM
# show server status, verify the status of server.
# scope monitoring; # scope sysdebug; # show cores , verify if there are any core files.
# scope security; # scope keyring default; #show detail, verify details for default keyring, expiry etc.
# connect nxos; # show int br | grep -v down | wc –l, verify the number of active Ethernet interfaces.
# scope security; # show authentication, review the authentication type.
# connect nxos; # show flogi database, review the flogi database.