简介
本文档介绍通过Intersight部署Hyperflex集群的常见故障排除方案。
先决条件
要求
Cisco 建议您了解以下主题:
使用的组件
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
背景信息
Intersight安装程序工作流程遵循图表中显示的任务来部署hyperflex集群:
任务名称 |
定义 |
PreparePreClusterInfoTask |
生成包含部署集群所需信息的配置文件(例如)。配置文件路径、软件YAML文件)。 |
ServerConfigurationVailadtionTask |
验证UCS服务器配置,确保其具有所需的硬件和固件配置(例如)。磁盘大小/PID验证、正确的网卡等。) |
PreConfigurationValidationTask |
在服务器配置启动之前验证网络配置(例如,DNS、NTP、vCenter可达性、重复IP检查) |
PrepareLocalImageRepoTask |
将软件映像(控制器VM OVA、hxdp软件包)下载到本地映像存储。此任务仅在连接的设备环境中运行时才包括在工作流程中。 |
服务器配置任务 |
在UCS服务器上执行所需配置。对于FI连接部署,这包括创建和关联服务配置文件。 |
HypervisorEsxConfigurationTask |
在虚拟机监控程序上配置网络部分。这包括使用Serial Over Lan向管理vSwitch添加上行链路并配置IP地址、主机名和DNS/NTP配置。 |
PreDeployValidationTask |
在集群部署开始之前执行验证。验证包括网络可达性检查和验证节点是否已属于另一个集群。 |
准备虚拟机监控程序部署任务 |
为控制器虚拟机(VM)配置准备虚拟机监控程序。从ESXi获取主机信息并确保设置正确的操作系统参数。 |
虚拟机监控程序网络任务 |
在ESXi主机上配置网络部分。包括在主机上配置集群运行所需的不同vSwitch/端口组。 |
HypervisorSoftwareUpdateTask |
更新虚拟机监控程序上的软件,该软件包括主机上所需的VIB(如果需要)。 |
HypervisorDatastoreTask |
如果需要,为控制器VM创建Datastore。 |
DeployHyperflexControllerVm |
根据需要在虚拟机监控程序上部署存储控制器OVA。 |
ConfigVmTask |
在控制器VM上配置网络部分,包括配置所需参数和数据/管理网络。 |
部署软件VmTask |
在控制器VM上安装HXDP软件包。 |
CollectNodeInfoTask |
收集节点信息,如UUID和IP。 |
CollectInventoryDataTask |
将资产数据发送到控制器VM。 |
CreateClusterValidationTask |
执行验证以确保控制器VM已准备好加入集群。包括MTU检查并验证存储服务是否已就绪。 |
CreateClusterTask |
创建存储群集并使用控制器VM将群集中的所有节点连接到一起。 |
PostInstallHostConfig |
在部署集群后配置主机。包括对Hyperflex集群配置文件中提供的新密码的ESXi密码更改。 |
PostInstallStorageControllerVmConfig |
在部署集群后配置控制器VM,将控制器VM密码更改为Hyperflex集群配置文件中提供的新密码 |
ClusterAutoClaimTask |
将HyperFlex集群声明给Intersight用户帐户。 |
问题
以下是您在集群部署中可以发现的常见错误:
验证错误/警告:
- 重复的IP(在同一交换矩阵互联上出错,如果全局重叠则发出警告)
- 2节点群集创建
- 2用于选择的复制因子(建议使用3的数据复制因子)
运行时验证:
- DNS,NTP不可访问
- vCenter无法访问或凭证不正确
- 已在使用的管理IP地址
部署错误:
- 同一L2域(上行链路交换机)中两个不同集群的相同数据VLAN
- 交叉链路
- ESXi IP配置失败(由于ESXi凭证不正确)
解决方案
根据失败的任务和遇到的错误,您可以执行建议的操作:
DNS/NTP不可访问
Validator_NTP_List, Status Code: 9 (FAILED), Message: There are no reachable NTP servers from list

操作:检查IP(如果修改策略不正确)并重新启动工作流。
无法访问vCenter
"vCenter reachability and credential check : vCenter server is not reachable or invalid vCenter credentials."

操作:如果vCenter IP/凭证不正确,请修改策略并重新启动工作流。
重复 IP
“IP address x.x.x.x already in use. Please verify there are no duplicate IPs.”

操作:检查IP是否已在使用,如果已使用,请修改策略并重新启动工作流。
连接主机失败
failed in Task: 'Connection to host' with Error: 'Host(x.x.x.x) is not reachable via device connector.
Please check the VLAN ID, IP address and gateway settings.'

操作:如果VLAN/ IP/网关不正确,请检查该策略并重新启动工作流程。
自动申请失败
"failed to claim the HyperFlex device connector.
This cluster requires continued connectivity to Intersight to ensure Fault Tolerance is maintained.
The cluster cannot tolerate failures until this step is completed. Please check the cluster connectivity to Intersight and perform a manual claim. "

操作:声明设备声明过程中概述的HyperFlex集群并重新启动工作流程。
未能配置服务器配置文件关联
failed in Task: 'Failed to Configure Server Profile Association

操作:
ESXi IP配置通过CIMC LAN串行通过控制台访问完成。有时,CIMC SoL无法将控制台进入登录提示符。通过KVM检查CIMC控制台到ESXi,并重置CIMC并重新启动工作流。
任务失败:监控操作系统启动
Configuring CIMC server: failed in Task: 'Failed to Configure Server Profile Association.' with Error: 'failed in Task: 'Monitor OS boot' with Error: 'OS Installation has failed'\"}}}}'

操作:
- 确保ESXi根密码正确
- 首次安装时,请确保检查出厂默认密码。
- 要重新安装,请确保取消选中出厂默认密码。
- 检查SoL访问失败。
- 检查设备连接器在操作系统引导期间是否已断开。
如果这是新安装,请确保提供的密码不是默认密码(Cisco123),即使选中了出厂默认密码单选按钮后也是如此。
此操作的结果是安装程序能够登录ESXi,但无法设置密码,因为默认密码的强度很弱
任务失败:根据Sha1验证OVA
Deploying Storage Controller VM on ESXi host: Failed in Task: “Verify OVA against Sha1"

操作:
- 检查ESXi是否未配置DNS。
- 检查ESXi管理IP子网是否因Intersight访问而被阻止。
任务失败:将主机添加到vCenter群集
failed in Task: Add host to vCenter Cluster with Error: Try adding host manually to vCenter and retry. failed to add the host x.x.x.x with 3 attempts

操作:
vCenter版本必须高于或等于集群中的所有主机。将vCenter升级到与ESXi版本相同或相等的更高版本,或将ESXi降级到稳定性较低的版本。
任务失败:网络存储控制器VM配置失败
failed in Task: 'Check Network for Storage Controller VM Configuration Result' with Error: 'Configure networking failed with error: Error while connecting to ESXi host. Please check the connection and retry'

操作:
EXSI API服务器偶尔无法按时响应。
- 检查主机服务状态以确保正在运行。
- 重新启动ESXi并重试部署。
由于MTU问题,工作流失败
failed in Task: 'Verify Storage Cluster' with Error: 'id: 2 entityRef: id: x.x.x.x name: x.x.x cluster message: Could not ping x.x.x.x with MTU 9000 during failover test.
Verify the VLAN and MTU on the upstream switch is correct prior to continuing. severity: warning'
操作:
未在所有路径中启用巨帧,启用巨帧后,必须在上行链路交换机中配置MTU值9216。请确保在所有路径中将MTU设置为巨帧,然后重新启动工作流
任务失败:将软件包复制到存储控制器VM
failed in Task: 'Copying Software Packages to Storage Controller VM(outbound)' with Error: 'Unexpected failure during module execution.

操作:
- 确保从SCVM到Intersight有网络连接。
- 检验网络中是否允许使用所需的端口。
- 有关网络要求,请参阅安装前检查链接。
相关信息