簡介
本文描述在HyperFlex中以維護模式輸入主機時最常見的問題。
必要條件
需求
- 對VMware vSphere的基本瞭解
- 對UCS Manager(UCSM)有基礎認識
- 網路基礎知識
採用元件
本文中的資訊係根據以下軟體和硬體版本:
- HyperFlex儲存控制器5.0.2d
- VMware ESXi、7.0.3、21930508
- vCenter版本:8.0.2內部版22617221
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
背景資訊
當您將主機進入思科HyperFlex的維護模式時遇到問題時,您可以採取幾個故障排除步驟來識別和解決問題。
設定
如果通過HX Connect啟動主機的維護模式失敗,請考慮使用ESXi UI進入維護模式,因為這有助於識別和消除典型的vCenter相關併發症。
提示:如果在集群中啟用分散式資源排程程式(DRS),則它可以自動管理vMotion進程。確保DRS設定為適當的自動化級別,或者如果DRS被禁用,您可能需要手動遷移或關閉源主機上的其他VM以平衡負載。
1.使用SSH客戶端通過根登入連線到ESXi。
2.檢查主機是否處於維護模式。(特定命令在不同版本中可能有所不同。)
esxcli system maintenanceMode get
3.將主機置於維護模式。
esxcli system maintenanceMode set -e true
4.驗證主機是否處於維護模式。
esxcli system maintenanceMode get
5.退出維護模式。
esxcli system maintenanceMode set -e false
常見錯誤
HX進入維護模式:某些節點(X-server-X)失敗。未在X節點上啟用vMotion

解決方案
配置VMkernel介面卡
- 使用vSphere客戶端登入到vCenter伺服器。
- 按一下選擇主機。
- 按一下Configuration頁籤。
- 按一下Networking下的VMkernel Adapter。
- 按一下「Add Networking」。
- 選擇VMkernel Adapter,然後按一下Next。
- 選擇Existing Standard vSwitch,選擇vMotion vSwitch,然後按一下Next。
- 在Network Label中輸入名稱以標識vMotion使用的網路。
- 從VLAN ID中選擇或輸入VLAN ID。
- 選中vMotion service覈取方塊,然後按一下Next。
- 輸入主機的vMotion介面的IP地址和子網掩碼。
- 按一下Next,然後按一下Finish。

驗證vSwitch是否使用的是適當的上行鏈路
- 使用vSphere客戶端登入到vCenter伺服器。
- 按一下選擇主機。
- 按一下Networking(網路)下的Virtual Switches(虛擬交換機)。
- 選擇Standard Switch:vMotion。
- 點選管理物理網路介面卡。
- 活動介面卡:vmnic3
- 備用介面卡vmnic7
- 按一下「Ok」以「Finish」。

附註:對於Hyperflex邊緣群集 — 使用post_install指令碼配置vMotion VMkernel埠(vmk2)。故障切換順序設定為主用/備用。
ESXi防火牆設定
在ESXi中,驗證主機之間的任何防火牆都沒有阻止vMotion流量。vMotion預設使用TCP埠8000,但也可能涉及其他埠,具體取決於您的配置。
來源:遠端(本地)ESXi vMotion VMkernel網路
目標:ESXi
連接埠:TCP 8000
[root@Monterrey-server-2:~] nc -zv 10.31.123.195 8000
Connection to 10.31.123.195 8000 port [tcp/*] succeeded!
附註:如果這是新部署,請運行hx_post_install指令碼以根據最佳做法配置vMotion介面。
運行hx_post_install指令碼
使用SSH客戶端通過管理員登入連線到群集虛擬IP。
鍵入hx_post_install並按Enter。
admin@SpringpathController:~$ hx_post_install
Select post_install workflow-
1. New/Existing Cluster
2. Expanded Cluster (for non-edge clusters)
3. Generate Certificate
Note: Workflow No.3 is mandatory to have unique SSL certificate in the cluster. By Generating this certificate, it will replace your current certificate. If you're performing cluster expansion, then this option is not required.
Selection: 1
Logging in to controller HX-01-cmip.example.com
HX CVM admin password:
Getting ESX hosts from HX cluster...
vCenter URL: 192.168.202.35
Enter vCenter username (user@domain): administrator@vsphere.local
vCenter Password:
Found datacenter HX-Clusters
Found cluster HX-01
post_install to be run for the following hosts:
HX-01-esxi-01.example.com
HX-01-esxi-02.example.com
HX-01-esxi-03.example.com
Enter ESX root password:
Enter vSphere license key? (y/n) n
Enable HA/DRS on cluster? (y/n) y
Successfully completed configuring cluster HA.
Disable SSH warning? (y/n) y
Add vmotion interfaces? (y/n) y
Netmask for vMotion: 255.255.254.0
VLAN ID: (0-4096) 208
vMotion MTU is set to use jumbo frames (9000 bytes). Do you want to change to 1500 bytes? (y/n) y
vMotion IP for HX-01-esxi-01.example.com: 192.168.208.17
Adding vmotion-208 to HX-01-esxi-01.example.com
Adding vmkernel to HX-01-esxi-01.example.com
vMotion IP for HX-01-esxi-02.example.com: 192.168.208.18
Adding vmotion-208 to HX-01-esxi-02.example.com
Adding vmkernel to HX-01-esxi-02.example.com
vMotion IP for HX-01-esxi-03.example.com: 192.168.208.19
Adding vmotion-208 to HX-01-esxi-03.example.com
Adding vmkernel to HX-01-esxi-03.example.com
Add VM network VLANs? (y/n) y
Attempting to find UCSM IP
Found UCSM 10.75.61.254, logging with username admin. Org is HX-Cluster
UCSM Password:
Port Group Name to add (VLAN ID will be appended to the name): USERS
VLAN ID: (0-4096) 1219
Adding VLAN 1219 to FI
Adding VLAN 1219 to vm-network-a VNIC template
Adding USERS-1219 to HX-01-esxi-01.example.com
Adding USERS-1219 to HX-01-esxi-02.example.com
Adding USERS-1219 to HX-01-esxi-03.example.com
Add additional VM network VLANs? (y/n) n
Run health check? (y/n) y
Validating cluster health and configuration...
Cluster Summary:
Version - 3.5(2i)
Model - HXAF220C-M5SX
Health - HEALTHY
ASUP enabled - False
admin@SpringpathController:~$
由於vCenter無法訪問,操作無法繼續

解決方案:重新註冊vCenter
- 使用SSH客戶端通過管理員登入連線到群集虛擬IP。
- 運行此命令:
stcli cluster reregister —vcenter-datacenter ...
- - vcenter-datacenter <資料中心名稱>
- - vcenter-cluster <cluster name>
- - vcenter-url <vcenter url ip或hostname>
- - vcenter-sso-url <sso url或使用vcenter ip,否則使用vcenter name/ip>
- - vcenter-user <vcenter username>示例
stcli cluster reregister --vcenter-datacenter "HX-DC-test" --vcenter-cluster "HX-Cluster-test" --vcenter-url "test.vsphere.lab" --vcenter-user "administrator@vsphere.local"
防火牆設定
確保埠80和443對傳入流量開放,以保持正確的伺服器功能。
nc -v <vcenter ip> 443
nc -v <vcenter ip> 80
hxshell:~$ nc -v 10.31.123.186 80
Connection to 10.31.123.186 80 port [tcp/http] succeeded!
hxshell:~$ nc -v 10.31.123.186 443
Connection to 10.31.123.186 443 port [tcp/https] succeeded!
注意:如果您最近更換了主機板,您可以聯絡技術支援中心(TAC)來幫助您運行主機板更換指令碼。
如果在執行這些檢查後問題仍然存在,請考慮聯絡思科的HyperFlex或VMware支援人員以尋求有關vMotion問題的幫助。他們可以基於您的環境和您遇到的確切錯誤消息提供特定指導。