Inleiding
In dit document wordt beschreven hoe u problemen kunt oplossen met veelvoorkomende fouten in de Intersight Health Check voor Hyperflex-clusters.
Voorwaarden
Vereisten
Cisco raadt kennis van de volgende onderwerpen aan:
- Dit zijn het Network Time Protocol (NTP) en het Domain Name System (DNS).
- Basiskennis van Linux-opdrachtregel.
- Basiskennis van VMware ESXi.
- Basiskennis van VI-teksteditor.
- Hyperflex Cluster Operations.
Gebruikte componenten
De informatie in dit document is gebaseerd op:
Hyperflex Data Platform (HXDP) 5.0.(2a) en hoger
De informatie in dit document is gebaseerd op de apparaten in een specifieke laboratoriumomgeving. Alle apparaten die in dit document worden beschreven, hadden een opgeschoonde (standaard)configuratie. Als uw netwerk live is, moet u zorgen dat u de potentiële impact van elke opdracht begrijpt.
Achtergrondinformatie
Cisco Intersight biedt de mogelijkheid om een reeks tests uit te voeren op een Hyperflex-cluster om ervoor te zorgen dat de status van het cluster optimaal is voor dagelijkse activiteiten en onderhoudstaken.
Vanaf HX 5.0(2a) introduceert Hyperflex een diag-gebruikersaccount met doorverwijsprivileges voor probleemoplossing in de opdrachtregel van Hyperflex. Verbinding maken met Hyperflex Cluster Management IP (CMIP) met behulp van SSH als een beheerdersgebruiker en vervolgens switch om de gebruiker te diagnosticeren.
HyperFlex StorageController 5.0(2d)
admin@192.168.202.30's password:
This is a Restricted shell.
Type '?' or 'help' to get the list of allowed commands.
hxshell:~$ su diag
Password:
____ __ _____ _ _ _ _____
| ___| / /_ _ | ____(_) __ _| |__ | |_ |_ _|_ _____
|___ \ _____ | '_ \ _| |_ | _| | |/ _` | '_ \| __| _____ | | \ \ /\ / / _ \
___) | |_____| | (_) | |_ _| | |___| | (_| | | | | |_ |_____| | | \ V V / (_) |
|____/ \___/ |_| |_____|_|\__, |_| |_|\__| |_| \_/\_/ \___/
|___/
Enter the output of above expression: 5
Valid captcha
diag#
Problemen oplossen
Fix ESXi VIB Controleer "Sommige van de geïnstalleerde VIB's gebruiken afgeschreven vmkAPI's"
Bij het upgraden naar ESXi 7.0 en hoger zorgt Intersight ervoor dat de ESXi-hosts in een Hyperflex-cluster geen stuurprogramma's hebben die zijn gebouwd met afhankelijkheden van oudere vmkapi-versies. VMware biedt een lijst van de getroffen vSphere Installation Bundles (VIB's) en beschrijft dit probleem in dit artikel: KB 78389
Meld u aan bij Hyperflex Connect Web User Interface (UI) en navigeer naar Systeeminformatie. Klik op Nodes en selecteer de Hyperflex (HX) -node. Klik vervolgens op Onderhoudsmodus HX invoeren.

Gebruik een SSH-client om verbinding te maken met het IP-beheeradres van de ESXi-host. Bevestig vervolgens de VIB's op de ESXi-host met deze opdracht:
esxcli software vib list
Verwijder de VIB met deze opdracht:
esxcli software vib remove -n driver_VIB_name
Start de ESXi-host opnieuw op. Wanneer het weer online is, selecteert u vanuit HX Connect de HX-node en klikt u op HX-onderhoudsmodus afsluiten.

Wacht tot het HX-cluster gezond is geworden. Voer vervolgens dezelfde stappen uit voor de andere knooppunten in het cluster.
Oplossing voor vMotion ingeschakeld "VMotion is uitgeschakeld op de ESXi-host"
Deze controle zorgt ervoor dat vMotion is ingeschakeld op alle ESXi-hosts in het HX-cluster. Vanuit vCenter moet elke ESXi-host een virtual switch (vSwitch) hebben, evenals een VMkernel-interface voor vMotion.

Verbinding maken met Hyperflex Cluster Management IP (CMIP) met behulp van SSH als een administratieve gebruiker en vervolgens deze opdracht uitvoeren:
hx_post_install
Selecteer optie 1 om vMotion te configureren:
admin@SpringpathController:~$ hx_post_install
Select hx_post_install workflow-
1. New/Existing Cluster
2. Expanded Cluster (for non-edge clusters)
3. Generate Certificate
Note: Workflow No.3 is mandatory to have unique SSL certificate in the cluster. By Generating this certificate, it will replace your current certificate. If you're performing cluster expansion, then this option is not required.
Selection: 1
Logging in to controller HX-01-cmip.example.com
HX CVM admin password:
Getting ESX hosts from HX cluster...
vCenter URL: 192.168.202.35
Enter vCenter username (user@domain): administrator@vsphere.local
vCenter Password:
Found datacenter HX-Clusters
Found cluster HX-01
post_install to be run for the following hosts:
HX-01-esxi-01.example.com
HX-01-esxi-02.example.com
HX-01-esxi-03.example.com
Enter ESX root password:
Enter vSphere license key? (y/n) n
Enable HA/DRS on cluster? (y/n) y
Successfully completed configuring cluster HA.
Disable SSH warning? (y/n) y
Add vmotion interfaces? (y/n) y
Netmask for vMotion: 255.255.254.0
VLAN ID: (0-4096) 208
vMotion MTU is set to use jumbo frames (9000 bytes). Do you want to change to 1500 bytes? (y/n) y
vMotion IP for HX-01-esxi-01.example.com: 192.168.208.17
Adding vmotion-208 to HX-01-esxi-01.example.com
Adding vmkernel to HX-01-esxi-01.example.com
vMotion IP for HX-01-esxi-02.example.com: 192.168.208.18
Adding vmotion-208 to HX-01-esxi-02.example.com
Adding vmkernel to HX-01-esxi-02.example.com
vMotion IP for HX-01-esxi-03.example.com: 192.168.208.19
Adding vmotion-208 to HX-01-esxi-03.example.com
Adding vmkernel to HX-01-esxi-03.example.com
Opmerking: voor Edge-clusters die met HX Installer worden geïmplementeerd, moet het hx_post_install-script worden uitgevoerd vanuit de CLI van HX Installer.
vCenter-connectiviteit herstellen Controleer "vCenter-connectiviteitscontrole mislukt"
Verbinding maken met Hyperflex Cluster Management IP (CMIP) met behulp van SSH als een beheerdersgebruiker en switch om de gebruiker te diagnosticeren. Zorg ervoor dat het HX-cluster met deze opdracht is geregistreerd in vCenter:
diag# hxcli vcenter info
Cluster Name : San_Jose
vCenter Datacenter Name : MX-HX
vCenter Datacenter ID : datacenter-3
vCenter Cluster Name : San_Jose
vCenter Cluster ID : domain-c8140
vCenter URL : 10.31.123.186
De vCenter-URL moet het IP-adres of de FQDN (Fully Qualified Domain Name) van de vCenter-server weergeven. Als de juiste informatie niet wordt weergegeven, registreert u het HX-cluster opnieuw met vCenter met deze opdracht:
diag# stcli cluster reregister --vcenter-datacenter MX-HX --vcenter-cluster San_Jose --vcenter-url 10.31.123.186 --vcenter-user administrator@vsphere.local
Reregister StorFS cluster with a new vCenter ...
Enter NEW vCenter Administrator password:
Cluster reregistration with new vCenter succeeded
Zorg voor connectiviteit tussen HX CMIP en vCenter met de volgende opdrachten:
diag# nc -uvz 10.31.123.186 80
Connection to 10.31.123.186 80 port [udp/http] succeeded!
diag# nc -uvz 10.31.123.186 443
Connection to 10.31.123.186 443 port [udp/https] succeeded!
De status van de reiniger herstellen Controle "Controle van de reiniger mislukt"
Verbinding maken met Hyperflex CMIP met behulp van SSH als een beheerdersgebruiker en vervolgens switch naar diag gebruiker. Voer deze opdracht uit om de node te identificeren waar de cleaner-service niet wordt uitgevoerd:
diag# stcli cleaner info
{ 'type': 'node', 'id': '7e83a6b2-a227-844b-87fb-f6e78e6a59be', 'name': '172.16.1.6' }: ONLINE
{ 'type': 'node', 'id': '8c83099e-b1e0-6549-a279-33da70d09343', 'name': '172.16.1.8' }: ONLINE
{ 'type': 'node', 'id': 'a697a21f-9311-3745-95b4-5d418bdc4ae0', 'name': '172.16.1.7' }: OFFLINE
In dit geval is 172.16.1.7 het IP-adres van de Storage Controller Virtual Machine (SCVM) waarop de cleaner niet actief is. Maak met SSH verbinding met het IP-beheeradres van elke SCVM in het cluster en zoek vervolgens met deze opdracht naar het IP-adres van eth1:
diag# ifconfig eth1
eth1 Link encap:Ethernet HWaddr 00:0c:29:38:2c:a7
inet addr:172.16.1.7 Bcast:172.16.255.255 Mask:255.255.0.0
UP BROADCAST RUNNING MULTICAST MTU:9000 Metric:1
RX packets:1036633674 errors:0 dropped:1881 overruns:0 frame:0
TX packets:983950879 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:723797691421 (723.7 GB) TX bytes:698522491473 (698.5 GB)
Start de cleaner-service op de betreffende node met deze opdracht:
diag# sysmtool --ns cleaner --cmd start
NTP-servicestatus herstellen "NTPD-servicestatus is OMLAAG"
Verbinding maken met HX CMIP met behulp van SSH als een beheerdersgebruiker en vervolgens switch om de gebruiker te diagnosticeren. Voer deze opdracht uit om te bevestigen dat de NTP-service is gestopt.
diag# service ntp status
* NTP server is not running
Als de NTP-service niet wordt uitgevoerd, voert u deze opdracht uit om de NTP-service te starten.
diag# priv service ntp start
* Starting NTP server
...done.
Repareren NTP-server bereikbaarheid "NTP-servers bereikbaarheid controleren mislukt"
Verbinding maken met HX CMIP met behulp van SSH als een beheerdersgebruiker en vervolgens switch om de gebruiker te diagnosticeren. Zorg ervoor dat de HX-cluster bereikbare NTP-server(s) heeft geconfigureerd. Voer deze opdracht uit om de NTP-configuratie in het cluster weer te geven.
diag# stcli services ntp show
10.31.123.226
Zorg ervoor dat er netwerkconnectiviteit is tussen elke SCVM in het HX-cluster en de NTP-server op poort 123.
diag# nc -uvz 10.31.123.226 123
Connection to 10.31.123.226 123 port [udp/ntp] succeeded!
Als de NTP-server die in het cluster is geconfigureerd, niet meer in gebruik is, kunt u een andere NTP-server in het cluster configureren.
stcli services ntp set NTP-IP-Address
Waarschuwing: stcli services ntp set overschrijft de huidige NTP configuratie in het cluster.
Repareer de bereikbaarheid van de DNS-server "DNS Reachability Check Failed"
Verbinding maken met HX CMIP met behulp van SSH als een beheerdersgebruiker en vervolgens switch om de gebruiker te diagnosticeren. Zorg ervoor dat de HX-cluster bereikbare DNS-server(s) heeft geconfigureerd. Voer deze opdracht uit om de DNS-configuratie in het cluster weer te geven.
diag# stcli services dns show
10.31.123.226
Zorg ervoor dat er netwerkconnectiviteit is tussen elke SCVM in het HX-cluster en de DNS-server op poort 53.
diag# nc -uvz 10.31.123.226 53
Connection to 10.31.123.226 53 port [udp/domain] succeeded!
Als de DNS-server die in het cluster is geconfigureerd, niet meer in gebruik is, kunt u een andere DNS-server in het cluster configureren.
stcli services dns set DNS-IP-Adrress
Waarschuwing: de dns-set van stcli-services overschrijft de huidige DNS-configuratie in het cluster.
Fix Controller VM Versie "Controller VM Versiewaarde ontbreekt in het instellingenbestand op de ESXi-host"
Deze controle zorgt ervoor dat elke SCVM guestinfo.stctlvm.version = "3.0.6-3" in het configuratiebestand bevat.
Meld u aan bij HX Connect en zorg ervoor dat het cluster gezond is.

Verbinding maken met elke ESXi-host in het cluster met behulp van SSH met de hoofdaccount. Voer vervolgens deze opdracht uit
[root@San-Jose-Server-1:~] grep guestinfo /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx
guestinfo.stctlvm.version = "3.0.6-3"
guestinfo.stctlvm.configrdm = "False"
guestinfo.stctlvm.hardware.model = "HXAF240C-M4SX"
guestinfo.stctlvm.role = "storage"
Let op: de naam van de datastore en de SCVM-naam kunnen verschillen in uw cluster. U kunt Spring typen en vervolgens op de Tab-toets drukken om de naam van de datastore automatisch in te vullen. Voor de SCVM-naam kunt u stCtl typen en vervolgens op de Tab-toets drukken om de SCVM-naam automatisch te voltooien.
Als het configuratiebestand van de SCVM geen guestinfo.stctlvm.version = "3.0.6-3" bevat, meldt u zich aan bij vCenter en selecteert u de SCVM. Klik op Acties, navigeer naar Aan/uit en selecteer Gast-besturingssysteem afsluiten om de SCVM sierlijk uit te schakelen.

Maak vanuit de ESXi Command Line Interface (CLI) een back-up van het SCVM-configuratiebestand met deze opdracht:
cp /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx.bak
Voer vervolgens deze opdracht uit om het configuratiebestand van de SCVM te openen:
[root@San-Jose-Server-1:~] vi /vmfs/volumes/SpringpathDS-FCH2119V1NH/stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx
Druk op de toets I om het bestand te bewerken, navigeer vervolgens naar het einde van het bestand en voeg deze regel toe:
guestinfo.stctlvm.version = "3.0.6-3"
Druk op de ESC-toets en typ :wq om de wijzigingen op te slaan.
Identificeer de Virtual Machine ID (VMID) van de SCVM met de opdracht vim-cmd vmsvc/getallvms en laad het configuratiebestand van de SCVM opnieuw:
[root@San-Jose-Server-1:~] vim-cmd vmsvc/getallvms
Vmid Name File Guest OS Version Annotation
1 stCtlVM-FCH2119V1NH [SpringpathDS-FCH2119V1NH] stCtlVM-FCH2119V1NH/stCtlVM-FCH2119V1NH.vmx ubuntu64Guest vmx-15
[root@San-Jose-Server-1:~] vim-cmd vmsvc/reload 1
De SCVM opnieuw laden en inschakelen met de volgende opdrachten:
[root@San-Jose-Server-1:~] vim-cmd vmsvc/reload 1
[root@San-Jose-Server-1:~] vim-cmd vmsvc/power.on 1
Waarschuwing: in dit voorbeeld is de VMID 1.
U moet wachten tot het HX-cluster weer gezond is voordat u naar de volgende SCVM gaat.
Herhaal dezelfde procedure één voor één op de betrokken SCVM's.
Meld u ten slotte aan bij elke SCVM met SSH en switch om een gebruikersaccount in te voeren. Start stMgr één node tegelijk opnieuw op met deze opdracht:
diag# priv restart stMgr
stMgr start/running, process 22030
Voordat u naar de volgende SCVM gaat, moet u ervoor zorgen dat stMgr volledig operationeel is met deze opdracht:
diag# stcli about
Waiting for stmgr management server on port 9333 to get ready . .
productVersion: 5.0.2d-42558
instanceUuid: EXAMPLE
serialNumber: EXAMPLE,EXAMPLE,EXAMPLE
locale: English (United States)
apiVersion: 0.1
name: HyperFlex StorageController
fullName: HyperFlex StorageController 5.0.2d
serviceType: stMgr
build: 5.0.2d-42558 (internal)
modelNumber: HXAF240C-M4SX
displayVersion: 5.0(2d)
Gerelateerde informatie
Let op: in dit voorbeeld is de VMID 1.