简介
本文档介绍对MDS 9000平台执行自动运行状况和配置检查的过程和要求。
先决条件
要求
只有运行受支持的NX-OS®软件版本的MDS平台才支持自动运行状况和配置检查。
支持以下硬件平台:
- 所有尚未达到最后支持日期的MDS 9000系列交换机:硬件请参阅以下位置的MDS生命周期终止和销售终止通知:
生命周期终止和销售终止通知
注意:硬件必须属于有效的思科合同,并且提交运行状况和配置检查的CCOID必须与同一合同关联。
使用的组件
本文档不限于特定的软件和硬件版本。
本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您的网络处于活动状态,请确保您了解所有命令的潜在影响。
规则
有关文档规则的详细信息,请参阅 Cisco 技术提示规则。
运行状况和配置检查过程
要对MDS交换机执行自动运行状况和配置检查,请在Cisco Support Case Manager中打开一个常规的TAC服务请求,并使用以下一组关键字:
技术:数据中心和存储网络
子技术:MDS9000 — 运行状况和配置检查(自动)
问题代码:运行状况和配置检查
对于打开的TAC SR,上传从交换机捕获的show tech-support details命令的输出,格式为.txt或.gz/.tar。 目前,支持以ASCII和UTF-8文本格式捕获的show tech-support details文件。有关上传说明,请参阅TAC客户文件上传。
从NX-OS 8.4(2d)和9.2(1)开始,MDS tac-pac命令已得到增强,可在bootflash上快速创建一个文件,其中包含显示技术支持详细信息以及附加的show logging onboard。这是为需要显示技术支持详细信息(包括自动运行状况和配置检查案例)的任何TAC服务请求(SR)创建输入文件的首选方法。
将所需输出附加到SR后,思科自动化将分析日志,并提供附加到发送给您的电子邮件的报告(PDF格式)。该报告包含检测到的问题的列表、排除问题的相关步骤以及建议的行动计划。
如果对报告的运行状况检查失败存在疑问,建议您打开包含适当关键字的单独服务请求以获取进一步帮助。强烈建议参考为自动运行状况和配置检查打开的服务请求(SR)编号以及生成的报告,以加快调查速度。
严重性级别
下表列出了下一个标准NX-OS严重性级别及其定义。
严重级别 |
描述 |
紧急(0) |
系统不可用. |
警报(1) |
关键性情况、需要立即关注 |
关键信息 (2) |
主要情况。 |
错误(3) |
次要条件。 |
警告(4) |
警告情况. |
通知(5) |
基本通知和参考消息。可能 无关紧要。 |
信息(6) |
表示返回到正常状态的正常事件。 |
运行状况和配置检查模块
自动MDS运行状况和配置检查版本1(2023年5月版本)执行表1中列出的检查。
表 1:运行状况检查模块和模块使用的关联CLI
索引 |
运行状况检查模块 |
单元简要说明 |
用于执行运行状况检查的CLI |
1 |
NX-OS版本检查 |
检查设备是否运行思科推荐的NX-OS软件版本。 |
show version |
2 |
MDS收发器检查EOL/EOS |
检查任何收发器是寿命终止(EOL)还是销售终止(EOS)。 |
show version show clock 显示硬件 |
3 |
MDS交换机上FC接口的数据速率使用情况 |
检查接口输入和输出速率。列出利用率高于80%的接口上的前10个接口和警报。 |
show version show interface brief show interface |
4 |
MDS交换机的收发器详细信息 |
检查接口温度、电压、电流、发射功率或接收功率的标称值。如果检测到故障,则建议后续步骤。 |
show version 显示硬件 show interface transceiver details |
5 |
根据运行NX-OS版本检查PSIRT缺陷 |
根据硬件/软件和配置与各种PSIRT进行匹配。这并非详尽无遗。 |
show version show running-config |
6 |
MDS检查时钟信息 |
检查建议的时钟配置,并提供建议的时钟配置示例。 |
show running-config show clock |
7 |
MDS硬件检查EOL/EOS |
确定MDS模块和机箱的寿命终止(EOL)和支持终止(EOS)日期。 |
show version show module 显示硬件 show inventory |
8 |
MDS软件检查EOL/EOS |
确定MDS NX-OS版本的寿命终止(EOL)和支持终止(EOS)日期。 |
show version show module |
9 |
MDS FCNS数据库和FLOGI数据库一致性检查 |
检查show FCNS数据库和show FLOGI数据库输出之间的一致性。 |
show version 显示硬件 show flogi database show fcns database local vsan 1-4093 |
10 |
MDS检查所有VSAN在所有TF端口上处于启用和活动状态 |
检查以确保所有TF端口都允许的VSAN处于活动状态,没有处于隔离或初始化状态的VSAN。 |
show version 显示硬件 show interface show interface brief show port-channel database |
11 |
MDS检查所有VSAN在所有TE端口上处于启用和活动状态 |
检查以确保所有TE端口都允许的VSAN处于活动状态,没有处于隔离或初始化状态的VSAN。 |
show version show module show interface show interface brief show port-channel database |
12 |
MDS OUI检查远程设备 |
检查以确保MDS识别通过中继和端口通道连接连接的OUI。 |
show flogi internal event-history error show port internal event — 历史错误 show system internal fcfwd idxmap interface show flogi internal event-history debugs show accounting log |
13 |
MDS CFS锁定检查 |
检查CFS锁和清除锁的建议步骤。 |
show version show module 显示硬件 show cfs lock show logging log show cfs internal session-history show cfs peers show fcdomain domain domain-list show cfs internal event-history error show clock |
14 |
MDS检查活动的Supervisor Mgmt0链路 |
检查是显示活动还是仅显示supervisor mgmt0链路状态。 |
show version show interface mgmt0 |
15 |
MDS 9700检查备用Supervisor管理0链路 |
检查备用supervisor mgmt0链路状态是否显示。仅对运行NX-OS 9.2(1)和更高版本的MDS 9700导向器有效。 |
show version show interface mgmt0 standby |
16 |
MDS次优PC成员分配检查 |
端口通道对于多交换机光纤通道SAN的恢复能力非常重要。为最大容错和硬件资源利用率配置端口通道有助于提高SAN的恢复能力。此模块检查找到的每个光纤通道端口通道,以确保其成员接口尽可能均匀地分布在交换机中的可用模块和转发引擎上。 |
show version show interface brief |
17 |
MDS FSPF一致性检查 |
检查每个ISL上的FSPF成本,以确保相邻交换机具有相同/一致的成本。如果ISL两端的开销不同,则可能会出现意外或非对称路由。此检查不适用于处于NPV模式的交换机,因为这些交换机中没有FSPF数据库。 |
show switchname show fspf database show fcs ie show npv internal info |
18 |
MDS高CPU使用率检查 |
通过检查多个命令输出,验证当前CPU使用率是否在预定限制内。如果使用率超过60%,则通知用户;如果使用率超过80%,则通知用户;如果使用率超过90%,则警告用户。 |
show processes cpu show processes cpu history show logging log |
19 |
MDS高内存利用率检查 |
检查几个不同的命令输出,以确定当前的内存使用率是否小于配置的阈值,或者是否有任何进程正在分配的内存限制内运行。如果使用率超过90%,则通知用户。 |
show version show processes memory show running-config |
20 |
MDS检查端口监控Tx-Datarate配置以检测过度使用 |
检查活动端口监控策略,确定tx-datarate和/或tx-datarate-burst计数器是否配置为正确检测过度使用。 |
show version show interface brief show running-config |
报告和警告
- 运行状况和配置检查SR由虚拟TAC工程师自动处理。
- 报告(采用PDF格式)通常在24个工作小时内生成并附加到SR的所有必要的日志。
- 报告通过邮件(源自Cisco TAC自动电邮<no-reply@cisco.com>)自动与服务请求相关的所有联系人(主要和次要)共享。
- 此报告也会附加到Service Request中,以便以后随时可用。
- 请注意,报告中列出的问题基于提供的日志,属于表1(之前所示)列出的运行状况检查模块的范围。
- 所执行的运行状况和配置检查列表并非详尽无遗,建议用户根据需要执行进一步的运行状况检查。
- 随着时间的推移,可以添加新的运行状况和配置检查。
常见问题解答
问题1:是否可以上传同一SR中多台交换机的show tech-support details以获取所有交换机的运行状况检查报告?
回答1:这是自动案例处理,运行状况检查由虚拟TAC工程师执行。仅对上传的第一个show tech-support details执行运行状况检查。
问题2:我可以为同一设备上传多个show tech-support详细信息(例如,每隔几个小时捕获)以对两者进行运行状况检查吗?
回答:这是由虚拟TAC工程师执行的自动无状态案例处理,并且对于上传到SR的第一个show tech-support details文件执行运行状况和配置检查,无论上传的文件是来自同一交换机还是不同交换机。
问题3:如果交换机的show tech-support details文件被压缩为单个rar/gz文件并上传到SR,我能否对其进行运行状况检查?
回答3:否。如果以单个rar/zip/gz文件形式上传多个show tech support详细信息,则仅处理存档中的第一个文件以进行运行状况检查。
问题4:如果对报告的某个运行状况检查失败有疑问,该怎么办?
回答:请打开单独的TAC服务请求,以获得有关特定运行状况检查结果的进一步帮助。强烈建议附加运行状况检查报告,并参阅为自动运行状况和配置检查打开的服务请求(SR)案例编号。
问题5:能否使用为Automated Health and Config Check打开的相同SR来排除所发现的问题?
回答:否。由于主动运行状况检查是自动进行的,请打开新的服务请求以排除故障并解决报告的问题。请注意,为运行状况检查打开的SR在运行状况报告发布后的24小时内关闭。
问题6:自动运行状况和配置检查是否针对运行比前面提到的版本旧版本的交换机的show tech-support details文件运行?
回答6:自动运行状况和配置检查针对前面提到的平台和软件版本构建。对于运行较旧版本的设备,这是尽力而为的,并且不能保证报告的准确性。
问题7:如何关闭为Health Check打开的SR?
回答:在发送第一个Health Check报告后,SR将在24小时内关闭。无需用户对SR关闭采取任何操作。
问题8:如何共享有关主动运行状况和配置检查的评论或反馈?
回答:通过电子邮件将其共享到MDS-HealthCheck-Feedback@cisco.com
问题9.从交换机上捕获show tech-support或show tech-support details的推荐方法是什么?
A9:如本文档前面所述,从NX-OS 8.4(2d)和9.2(1)开始,MDS tac-pac命令已得到增强,可在Bootflash上快速创建一个文件,其中包含一个show tech-support详细信息以及附加的show logging onboard命令。这是为需要显示技术支持详细信息(包括自动运行状况和配置检查)的任何TAC服务请求(SR)创建输入文件的首选方法。捕获到终端应用(例如,SecureCRT、PuTTY)中的日志文件的CLI输出可能为UTF-8-BOM格式(或类似格式),而自动运行状况检查不支持此格式。自动运行状况和配置检查仅支持ASCII或UTF-8格式的文件。
执行Nexus运行状况和配置检查
请参阅执行Nexus运行状况和配置检查。
反馈
如果您有任何意见或建议(例如,关于生成的报告的易用性、范围、质量等),请在此处共享这些意见MDS-HealthCheck-Feedback@cisco.com。