目标
应用策略基础设施控制器(APIC)固态驱动器(SSD)的耐用性在特定类型SSD的高使用率过程中耗尽。这会导致SSD写入速度慢,SSD可以变为只读。当SSD驱动器降级时,可能导致APIC服务中的CPU峰值。
Field Notice:FN - 64329建议将产品ID为APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV的所有APIC SSD更换为新企业,而不论其利用率如何级SSD — 部件号UCS-SD200G12S3-EP。
本文档概述了如何识别受现场通知影响的APIC上的SSD产品ID以及如何更换APIC上的SSD的过程。
它将补充下面列出的现有SSD更换文档
思科APIC SSD更换版本3.x及更低版本
思科APIC SSD更换版本4.x及更高版本
常见症状
在从2.3开始的ACI版本中,APIC中还生成了一个故障,以便在接近SSD耐用性问题时通知您。
F2730:fltEqptStorageWearout-Warning
F2731:fltEqptStorageWearout — 主要
F2732:fltEqptStorageWearout-Critical
示例:
故障F2730:"安装在/dev/sdb的节点x上的存储单元/dev/sdb的剩余寿命为x% [此故障将提供SSD序列号]"
故障F2730
此特定SSD耐用性问题存在于两种产品ID为APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV的SSD中。
思科建议您更换这些SSD,而不论使用率如何,使用新的企业级SSD。
您的APIC SSD是否受到影响 — 如何检查?
要确定APIC SSD产品ID是否受现场通知的影响,请从CIMC GUI获取SSD SN。
对于CIMC 3.0(4)或更高版本
登录思科IMC GUI。
a — 使用切换导航(左上角)、存储、Cisco 12G SAS模块化RAID控制器展开CIMC菜单
b — 点击物理驱动器信息
c — 在左侧,物理驱动器,选择PD-1(它应该是SSD)
d — 常规,介质类型应为SSD
e — 查询数据、驱动器序列号并复制序列号
f — 将SSD序列号粘贴到以下网站,并检查SSD序列号是否与受影响的产品ID匹配
g — 您还可以从下面的屏幕中检查“剩余寿命百分比”以显示使用情况。
https://cway.cisco.com/sncheck/
思科IMC 3.0(4d)
或者
对于3.0(4)之前的CIMC版本
登录思科IMC GUI。
a — 选择存储,Cisco UCSC RAID SAS 200xx
b — 点击物理驱动器信息
c — 从物理驱动器列表中选择SSD
d — 查询数据、驱动器序列号并复制序列号
e — 将SSD序列号粘贴到以下网站,并检查SSD序列号是否与受影响的产品ID匹配
https://cway.cisco.com/sncheck/
思科IMC 2.0(9c)
2 — 如果APIC SSD SN与受影响的产品ID APIC-SD120G0KS2-EV和/或APIC-SD120GBKS4-EV匹配,请使用APIC SSD序列号和CDETS创建TAC案例CSCvc84794
在更换SSD之前检查列表
1.如果您的思科IMC版本早于2.0(9c),则必须先升级思科IMC软件,然后才能更换固态驱动器(SSD)。 请参阅目标思科IMC版本的思科IMC版本说明,以确定从当前版本到目标版本的推荐升级路径。每个ACI版本在ACI版本说明中都有推荐的思科IMC版本。请按照当前版本的Cisco主机升级实用程序(HUU)用户指南中的说明,在此链接上执行升级操作。
2.在思科IMC BIOS中,验证受信任平台模块(TPM)状态是否设置为“已启用”。 使用KVM控制台访问BIOS设置,您可以在Advanced > Trusted Computing > TPM State下查看和配置TPM状态。
通过思科IMC KVM的APIC BIOS
注意:如果TPM状态为“禁用”,APIC将无法启动。
3.从思科软件下载站点获取ACI APIC .iso映像。
4.只有集群中至少有一个APIC具有正常的SSD,这完全适合时,才应执行此程序。如果集群中的所有APIC控制器都有SSD出现故障,请向思科技术支持中心(TAC)提交案例。 以下快照来自所有APIC都处于完全适合状态的集群。
APIC GUI 4.1(2g)
5.更换APIC SSD后,必须重新配置APIC,并需要以下信息[此信息将用于“SSD更换步骤4-d”]:
- 交换矩阵名称
- 控制器数量
- 控制器ID
- 隧道终端地址(TEP)的IP地址池
- 网桥域组播地址(GIPO)的IP地址池
- 管理接口速度/双工模式
- 基础设施网络的VLAN ID
- 用于带外管理的IPv4/IPv6地址
- 默认网关的IPv4/IPv6地址
- 强密码检查
使用当今的技术:如何查找在设置APIC1期间使用的配置值?
SSD更换程序
第 1 步
从集群中的另一个APIC中,停用要更换其SSD的APIC。
a — 在菜单栏中,选择System > Controllers。
b — 在导航窗格中,展开控制器(Controllers)> apic_controller_name(apic_controller_name)>按节点查看的集群(Cluster as Seen by Node)。对于APIC_controller_name,指定未停用的APIC控制器。
c — 在“工作”(Work)窗格中,在继续操作之前,验证“活动控制器”(Active Controllers)摘要表中的“运行状况”(Health State)是否指示集群已完全适合。
d — 在同一工作窗格中,选择要停用的控制器,然后点击操作>停用。
e — 点击是。停用的控制器在“运行状态”列中显示“未注册”。然后,控制器将停止服务,并且在“工作”窗格中不再可见。
APIC GUI 4.1(2g)
步骤 2
物理移除旧SSD(如果有),然后添加新SSD。
步骤 3
在思科IMC中,使用新安装的SSD创建RAID卷。
对于CIMC版本3.0(4)或更高版本
a — 登录思科IMC。
b — 使用切换导航(左上角)、存储、思科12G SAS模块化RAID控制器展开CIMC菜单
思科IMC 3.0(4d)
c — 点击Clear Config(清除配置)并选择ok(如果可选)
d — 点击从未使用的物理驱动器创建虚拟驱动器
思科IMC 3.0(4d)
e - RAID级别,从下拉列表中选择0
f — 创建驱动器组,选择物理驱动器并将其移动到驱动器组
g — 虚拟驱动器属性,选择创建虚拟驱动器
思科CIMC 3.0(4d)
h — 仍在存储中,思科12G SAS模块化RAID控制器,选择虚拟驱动器信息
i — 将RAID级别为RAID 0的虚拟驱动器标识为RAID 0,选择它,然后从下拉列表中选择初始化,然后点击快速初始化,然后选择初始化VD
思科CIMC 3.0(4d)
对于3.0(4)之前的CIMC版本
a — 登录思科IMC。
b — 选择存储>物理驱动器。选择新添加的物理驱动器。
c — 选择存储>控制器驱动器信息,然后点击清除外部配置(如果可选)。
d — 点击确定。
e — 选择存储控制器驱动器信息,然后单击从未使用的物理驱动器创建虚拟驱动器。
思科IMC 2.0(9c)
f — 从Raid级别下拉列表中选择0。
g — 点击创建虚拟驱动器。
思科IMC 2.0(9c)
h — 选择新创建的虚拟驱动器,然后点击Initialize。
i — 从下拉列表中选择Initialize Type,然后点击Fast Initialize。
思科IMC 2.0(9c)
步骤 4
在思科IMC中,使用虚拟介质安装APIC映像。在此步骤中,对SSD进行分区,并在HDD上安装APIC软件。
NOTE:有关思科APIC版本4.x或更高版本的全新安装,请参阅《思科APIC安装、升级和降级指南》。
a — 使用思科IMC vMedia功能装载APIC .iso映像。
b — 启动APIC控制器或重新通电。
思科IMC 3.0(4d)
c — 在引导过程中按F6选择Cisco vKVM映射vDVD作为一次性引导设备。您可能需要输入BIOS密码。默认密码为“password”。
思科IMC 3.0(4d)
思科IMC 3.0(4d)
思科IMC 3.0(4d)
思科IMC 3.0(4d)
d — 在初始启动期间,运行配置脚本。按照屏幕上的说明配置APIC软件的初始设置。使用在开始或使用当天的技术之前在检查列表中收集的信息:如何查找在设置APIC1期间使用的配置值?
思科IMC 3.0(4d)
e — 安装完成后,取消映射虚拟媒体安装。
思科IMC 3.0(4d)
步骤 5
从集群中的APIC委托停用的APIC。
a — 选择属于集群的任何其他APIC。从菜单栏中,选择系统>控制器。
b — 在导航窗格中,展开控制器(Controllers)> apic_controller_name(apic_controller_name)>按节点查看的集群(Cluster as Seen by Node)。对于apic_controller_name,指定属于集群的任何活动控制器。
c — 从Work窗格中,点击Operational State列中显示Unregistered的停用控制器。
d — 在“工作”(Work)窗格中,点击操作(Actions)>佣金(Commission)。
e — 在“确认”对话框中,单击“是”。
APIC GUI 4.1(2g)
受委托的控制器将运行状况显示为“完全适合”,将运行状态显示为“可用”。控制器现在应该在Work窗格中可见。
现场通知/Bug参考
Field Notice:FN - 64329 — 固态驱动器利用率高后APIC SSD降级 — 硬件升级可用
固态驱动器利用率高后APIC SSD降级 |故障F2730