簡介
本文檔介紹對MDS 9000平台執行自動運行狀況和配置檢查的過程和要求。
必要條件
需求
只有運行受支援的NX-OS®軟體版本的MDS平台支援自動運行狀況和配置檢查。
支援的硬體平台如下:
- 尚未達到最後支援日期的所有MDS 9000系列交換機:硬體請參閱以下網址中的MDS生命週期終止和銷售終止通知:
生命週期終止和銷售終止通知
採用元件
本文件所述內容不限於特定軟體和硬體版本。
本文中的資訊是根據特定實驗室環境內的裝置所建立。文中使用到的所有裝置皆從已清除(預設)的組態來啟動。如果您的網路運作中,請確保您瞭解任何指令可能造成的影響。
慣例
如需文件慣例的詳細資訊,請參閱思科技術提示慣例。
運行狀況和配置檢查過程
要在MDS交換機上執行自動運行狀況和配置檢查,請在Cisco 支援案例管理器使用下列一組關鍵字提交常規TAC服務請求:
技術:資料中心與儲存網路
子技術:MDS9000 -運行狀況和配置檢查(自動)
問題代碼:運行狀況和配置檢查
對於打開的TAC SR,上傳從交換機捕獲的「show tech-support details」命令的輸出,格式為.txt或.gz/.tar。 目前支援以ASCII和UTF-8文字格式擷取的show tech-support details檔案。有關上傳說明,請參閱TAC客戶檔案上傳。
從NX-OS 8.4(2d)和9.2(1)開始,MDS tac-pac命令已得到增強,可在bootflash上快速建立包含顯示技術支援詳細資訊以及附加show logging onboard的檔案。對於任何需要顯示技術支援詳細資訊(包括自動運行狀況和配置檢查案例)的TAC服務請求(SR),這是建立輸入檔案的首選方法。
在所需輸出附加至SR後,思科自動化會分析日誌,並在傳送給您的郵件中提供附加報告(PDF格式)。該報告包含已檢測問題的清單、排除問題的相關步驟以及建議的行動計畫。
如果對報告的運行狀況檢查失敗有疑問,建議使用者打開一個包含相應關鍵字的單獨服務請求以獲取進一步幫助。強烈建議參閱為自動運行狀況和配置檢查打開的服務請求(SR)編號以及生成的報告,以加快調查速度。
嚴重性等級
下表列出了下一個標準NX-OS嚴重性級別及其定義。
嚴重性級別 |
說明 |
緊急(0) |
系統無法使用。 |
警示(1) |
危急狀況需要立即關注。 |
嚴重(2) |
主要情況。 |
錯誤(3) |
輕微情況。 |
警告(4) |
警告條件。 |
通知(5) |
基本通知和資訊性消息。可能 無關緊要。 |
資訊(6) |
正常事件,表示返回正常狀態。 |
運行狀況和配置檢查模組
自動MDS運行狀況和配置檢查版本1(2023年5月發佈)執行表1中列出的檢查。
表1:模組使用的運行狀況檢查模組和相關CLI
索引 |
狀況檢查模組 |
模組的簡短說明 |
用於執行運行狀況檢查的CLI |
1 |
NX-OS版本檢查 |
檢查裝置是否運行Cisco建議的NX-OS軟體版本。 |
顯示版本 |
2 |
MDS收發器檢查EOL/EOS |
檢查是否有任何收發器處於壽命終止(EOL)或銷售終止(EOS)狀態。 |
顯示版本 show clock 顯示硬體 |
3 |
MDS交換機上FC介面的資料速率使用情況 |
檢查介面輸入和輸出速率。列出利用率高於80%的介面上的前10個介面和警報。 |
顯示版本 show interface brief |
4 |
MDS交換機的收發器詳細資訊 |
檢查介面溫度、電壓、電流、Tx電源或rx電源的額定值。如果檢測到故障,建議採取後續步驟。 |
顯示版本 顯示硬體 顯示介面收發器詳細資訊 |
5 |
根據正在運行的NX-OS版本檢查PSIRT缺陷 |
根據硬體/軟體和配置,與各種PSIRT匹配。這並非詳盡無遺。 |
顯示版本 show running-config |
6 |
MDS檢查時鐘資訊 |
檢查建議的時鐘配置,並提供建議的時鐘配置示例。 |
show running-config show clock |
7 |
MDS硬體檢查以取得EOL/EOS |
確定MDS模組和機箱的壽命終止(EOL)和支援終止(EOS)日期。 |
顯示版本 show module 顯示硬體 顯示庫存 |
8 |
MDS軟體檢查EOL/EOS |
確定MDS NX-OS版本的壽命終止(EOL)和支援終止(EOS)日期。 |
顯示版本 show module |
9 |
MDS FCNS資料庫和FLOGI資料庫一致性檢查 |
檢查show FCNS資料庫和show FLOGI資料庫輸出之間的一致性。 |
顯示版本 顯示硬體 show flogi database show fcns database local vsan 1-4093 |
10 |
MDS檢查所有TF埠上的所有VSAN是否均已啟動並處於活動狀態 |
檢查以確保所有TF埠都允許所有VSAN處於活動狀態,沒有處於隔離或初始化狀態的VSAN。 |
顯示版本 顯示硬體 顯示介面 show interface brief show port-channel database |
11 |
MDS檢查所有TE埠上的所有VSAN是否均已啟動並處於活動狀態 |
檢查以確保所有TE埠都允許所有VSAN處於活動狀態,沒有處於隔離或初始化狀態的VSAN。 |
顯示版本 show module 顯示介面 show interface brief show port-channel database |
12 |
MDS OUI檢查遠端裝置 |
檢查以確保MDS可辨識透過中繼和埠通道連線連線的OUI。 |
show flogi internal event-history error show port internal event-history error show system internal fcfwd idxmap interface show flogi internal event-history debugs 顯示記帳日誌 |
13 |
MDS CFS鎖定檢查 |
檢查CFS鎖定和清除鎖定的建議步驟。 |
顯示版本 show module 顯示硬體 show cfs lock show logging log show cfs internal session-history show cfs peers show fcdomain domain-list show cfs internal event-history error show clock |
14 |
MDS檢查活動的Supervisor Mgmt0鏈路 |
檢查活動或僅supervisor mgmt0鏈路狀態是否顯示「up」。 |
顯示版本 show interface mgmt0 |
15 |
MDS 9700檢查備用管理引擎mgmt0鏈路 |
檢查備用supervisor mgmt0鏈路狀態是否顯示「up」。僅對運行NX-OS 9.2(1)及更高版本的MDS 9700導向器有效。 |
顯示版本 show interface mgmt0 standby |
16 |
MDS次優個人電腦成員配置檢查 |
埠通道對於多交換機光纖通道SAN的恢復能力非常重要。為最大容錯和硬體資源利用率配置埠通道有助於提高SAN的恢復能力。此模組檢查詢到的每個光纖通道埠通道,以確保其成員介面在交換機中的可用模組和轉發引擎之間儘可能均勻地分佈。 |
顯示版本 show interface brief |
17 |
MDS FSPF一致性檢查 |
檢查每個ISL上的FSPF成本,以確保相鄰交換機具有相同/一致的成本。如果ISL每一端的成本不同,則會發生非預期或非對稱路由。此檢查不適用於處於NPV模式的交換機,因為這些交換機中沒有FSPF資料庫。 |
show switchname show fspf database show fcs ie show npv internal info |
18 |
MDS高CPU利用率檢查 |
透過檢查多個命令輸出,驗證當前CPU利用率是否在預定限度內。如果使用率超過60%請通知使用者,如果使用率超過80%請通知使用者,如果使用率超過90%請警告使用者。 |
show processes cpu show processes cpu history show logging log |
19 |
MDS高記憶體利用率檢查 |
檢查幾個不同的命令輸出,以確定當前記憶體使用率是否小於配置的閾值,或者是否有任何進程在分配的記憶體限制內運行。如果使用率超過90%,請通知使用者。 |
顯示版本 show processes memory show running-config |
報告和警告
- 運行狀況和配置檢查SR是自動執行的,由虛擬TAC工程師處理。
- 報告(PDF格式)通常在服務請求所附的所有必要記錄後24個工作小時內生成。
- 該報告將透過電子郵件(源自Cisco TAC自動電子郵件<no-reply@cisco.com>)與服務請求相關的所有聯絡人(主要和輔助)自動共用。
- 此報告也會附加到Service Request中,以便稍後隨時可用。
- 請注意,報告中列出的問題基於提供的日誌,並且屬於表1(之前所示)中列出的運行狀況檢查模組的範圍。
- 執行的運行狀況和配置檢查清單不是詳盡的,建議使用者根據需要執行進一步的運行狀況檢查。
- 隨著時間的推移,可以增加新的運行狀況和配置檢查。
常見問題
問題1:是否可以上傳同一SR中多台交換機的show tech-support詳細資訊,以獲取所有交換機的運行狀況檢查報告?
答1:這是自動案例處理,運行狀況檢查由虛擬TAC工程師執行。運行狀況檢查僅針對上傳的第一個show tech-support詳細資訊進行。
問題2:是否可以上傳同一裝置的多個show tech-support詳細資訊(相隔幾個小時捕獲),以便同時進行運行狀況檢查?
答2:這是由虛擬TAC工程師執行的自動無狀態案例處理,且會對上傳到SR的第一個show tech-support details檔案執行運行狀況和配置檢查,無論上傳的檔案來自同一交換機還是不同交換機。
問題3:我能否檢查交換機的運行狀況,這些交換機的show tech-support details檔案被壓縮為單個rar/gz檔案並上傳到SR?
A3:否。如果多個show tech support詳細資訊以單一rar/zip/gz檔案上傳,則只會處理查扣檔中的第一個檔案以進行健全狀況檢查。
問題4:如果對其中一個報告的運行狀況檢查失敗有疑問,該怎麼辦?
A4:請另外提出一個TAC服務請求,以獲得有關特定運行狀況檢查結果的進一步幫助。強烈建議您附加運行狀況檢查報告,並參閱為自動運行狀況和配置檢查打開的服務請求(SR)案例編號。
問題5:我是否可以使用為Automated Health and Config Check打開的相同SR對發現的問題進行故障排除?
A5:否。由於主動運行狀況檢查是自動執行的,請提交新的服務請求以進行故障排除並解決報告的問題。請注意,為進行運行狀況檢查而打開的服務請求在運行狀況報告發佈後的24小時內關閉。
問題6:自動運行狀況和配置檢查是否針對運行版本早於前面所述版本的交換機的show tech-support details檔案運行?
答6:自動運行狀況和配置檢查是針對前面提到的平台和軟體版本而構建的。對於運行較舊版本的裝置,這是盡力而為,並且不保證報告的準確性。
問題7:如何關閉為運行狀況檢查打開的SR?
A7:SR會在傳送第一份「狀況檢查」報表後的24小時內關閉。使用者無需對SR關閉採取任何操作。
問題8:如何分享關於主動式運行狀況和配置檢查的意見或反饋?
答8:透過電子郵件傳送到MDS-HealthCheck-Feedback@cisco.com共用這些資訊
問題9.建議採用什麼方法從交換機獲取「show tech-support」或「show tech-support details」?
A9:如本文檔前面所述,從NX-OS 8.4(2d)和9.2(1)開始,MDS tac-pac命令已得到增強,可在bootflash上快速建立包含顯示技術支援詳細資訊以及附加show logging onboard的檔案。對於任何需要顯示技術支援詳細資訊(包括自動運行狀況和配置檢查)的TAC服務請求(SR),這是建立輸入檔案的首選方法。在終端應用程式中(例如,SecureCRT、PuTTY)捕獲到日誌檔案的CLI輸出可能為UTF-8-BOM格式(或類似格式),而自動化運行狀況檢查不支援此格式。自動運行狀況和配置檢查僅支援ASCII或UTF-8格式的檔案。
執行Nexus運行狀況和配置檢查
請參閱執行Nexus運行狀況和配置檢查。
意見回饋
我們非常感謝您對這些工具的操作有任何反饋。 如果您有任何意見或建議(例如,關於生成的報告的易用性、範圍、品質等),請在此處共用MDS-HealthCheck-Feedback@cisco.com。