本文描述如何對磁碟、 RAID和硬體問題進行故障排除。
您可以從中央管理器或命令列檢查磁碟運行狀況。在Central Manager上,選擇要檢查的裝置,然後選擇Monitor > Disks以獲取有關磁碟狀態的報告。有關詳細資訊,請參閱思科廣域應用服務配置指南中的磁碟報告部分。
在命令列中,可以使用show disks details命令,如下所示:
WAE674# show disks details RAID Physical disk information: disk00: Online J8WM2DTC 286102 MB disk01: Rebuilding J8WMPV9C 286102 MB <-------replaced disk is rebuilding disk02: Online J8WMYG6C 286102 MB RAID Logical drive information: Drive 1: RAID-5 Critical <-------RAID logical drive is rebuilding Enabled (read-cache) Enabled (write-back) Mounted file systems: MOUNT POINT TYPE DEVICE SIZE INUSE FREE USE% /sw internal /dev/sda1 991MB 892MB 99MB 90% /swstore internal /dev/sda2 991MB 733MB 258MB 73% /state internal /dev/sda3 7935MB 176MB 7759MB 2% /local/local1 SYSFS /dev/sda6 22318MB 139MB 22179MB 0% .../local1/spool PRINTSPOOL /dev/data1/spool 991MB 32MB 959MB 3% /obj1 CONTENT /dev/data1/obj 248221MB 130MB 248091MB 0% /dre1 CONTENT /dev/data1/dre 248221MB 130MB 248091MB 0% /ackq1 internal /dev/data1/ackq 991MB 32MB 959MB 3% /plz1 internal /dev/data1/plz 2975MB 64MB 2911MB 2% Disk encryption feature is disabled.
使用show disks tech-support命令檢查RAID-5磁碟的預測故障分析(PFA)標誌也很有用。您可以在輸出結尾找到PFA標誌。如果PFA標誌設定為「是」,則表示預計的驅動器故障,您應更換磁碟。WAE上也發出嚴重警報。
系統會自動檢測磁碟故障。系統會自動從服務中刪除故障磁碟。
您也可以使用以下命令關閉磁碟以進行計畫內更換:
對於RAID-5系統:
WAE674# disk disk-name disk01 replace Controllers found: 1 Command completed successfully.
更換RAID-5系統上的磁碟後,系統將自動重建邏輯RAID驅動器。
對於RAID-1系統:
WAE7326# config WAE7326(config)# disk disk-name disk01 shutdown Device maybe busy while going offline ... please wait! mdadm: set /dev/sdb1 faulty in /dev/md0 mdadm: set /dev/sdb2 faulty in /dev/md1 . . .
更換RAID-1系統上的磁碟後,請使用以下命令重新啟用該磁碟:
WAE7326# config WAE7326(config)# no disk disk-name disk01 shutdown
在RAID-5系統中,當更換硬碟時,會進行RAID重建;當通過CD將WAAS安裝到系統時,或運行disk recreate-raid EXEC命令時,會進行RAID同步。在RAID重建或同步過程中(由RAID韌體管理),當使用RAID配置設定驅動器時,硬碟LED持續閃爍。在帶有六個300 GB硬碟的WAE-7371上,RAID陣列重建或同步過程可能需要長達6小時才能完成。不幸的是,沒有剩餘時間的跡象。
注意:當任何驅動器LED指示燈閃爍時,請勿重新啟動系統或從系統中卸下磁碟,因為磁碟可能已損壞。
如果在RAID生成過程中確實刪除了磁碟,請重新插入該磁碟,並最多等待6小時以完成RAID生成過程。
RAID重建和同步略有不同,如下所示:
確保WAE-7341/7371/674裝置具有推薦的RAID控制器韌體5.2-0(15418)。 您可以使用show disks tech-support命令檢查RAID控制器韌體,如下所示:
wae# show disks tech-support Controllers found: 1 ---------------------------------------------------------------------- Controller information ---------------------------------------------------------------------- Controller Status : Okay Channel description : SAS/SATA Controller Model : IBM ServeRAID 8k Controller Serial Number : 40453F0 Physical Slot : 0 Installed memory : 256 MB Copyback : Disabled Data scrubbing : Disabled Defunct disk drive count : 0 Logical drives/Offline/Critical : 1/0/0 --------------------------------------------------- Controller Version Information --------------------------------------------------- BIOS : 5.2-0 (15418) Firmware : 5.2-0 (15418) <-----Firmware version Driver : 1.1-5 (2449) Boot Flash : 5.1-0 (15418) --------------------------------------------------- . . .
如果您的RAID控制器韌體需要更新,請從Cisco軟體下載網站(僅供註冊客戶使用)獲取推薦的版本,並按照韌體隨附的文檔中的說明升級韌體。
WAE-7341/7371/674裝置旨在從內部CF儲存裝置啟動,而不是從硬碟啟動。如果無意中將WAE BIOS更改為從硬碟啟動,則WAE將無法啟動。
如果遇到這種情況,請將BIOS改回從快閃記憶體引導,以允許正確引導。有關如何更改啟動順序的詳細資訊,請參閱思科廣域應用引擎7341、7371和674硬體安裝指南中的使用配置/設定實用程式一章。您可以選擇Load Default Settings選項恢復正確的預設設定,包括從內部緊湊型快閃記憶體儲存裝置引導。
有時,在裝置啟動期間多次重新通電後,串列埠會變為禁用。
如果遇到這種情況,您應該重新啟用串列埠。有關詳細資訊,請參閱思科廣域應用引擎7341、7371和674硬體安裝指南中的使用配置/設定實用程式一章。您可以選擇Load Default Settings選項恢復正確的預設設定,包括啟用串列埠。
要監控Cisco WAE和WAVE裝置上的引導過程,請按照《硬體安裝指南》中的說明連線到裝置上的串列控制檯埠。
Cisco WAE和WAVE裝置具有影片聯結器,不應在正常操作中使用。影片輸出僅用於在BIOS啟動期間進行故障排除,一旦串列埠變為活動狀態,將停止顯示輸出。
如果正在監控影片輸出,則當輸出停止時,裝置可能已停止啟動,但正常情況下,當裝置繼續啟動時,影片輸出將停止。
如果在WAE-612裝置上運行WAAS 4.0.11版或更早的版本,並且磁碟出現故障,則更換過程會有所不同,具體取決於故障症狀和正在使用的WAAS版本。根據故障症狀,請參見以下各節:
如果運行的是WAAS版本4.0.13或更高版本,請參閱Cisco廣域應用服務配置指南中的為RAID-1系統執行磁碟維護部分,了解熱交換磁碟更換過程。
附註:在運行4.0.13到4.0.19之間的任何WAAS版本(支援熱更換驅動器)的WAE-612上,在裝置運行時更換驅動器時可能會出現問題。有時,在驅動器熱插拔過程之後,WAE-612可能會停止運行並需要重新啟動。要避免此問題,請將WAAS軟體升級到4.0.19版或更高版本。
如果僅插槽01中的磁碟(右插槽)發生故障且磁碟00正常,請使用以下步驟更換磁碟,具體取決於裝置上的WAAS版本。
WAAS 4.0.5版及更低版本
WAAS版本4.0.7至4.0.11
如果disk00發生故障,而disk01顯示Problem狀態,狀態旁邊有星號(*)(星號表示磁碟被標籤為損壞),則表示disk00出現故障,但disk01被誤分類為損壞,並且其分割槽表已被刪除。在這種情況下,更換磁碟後所有資料都將丟失。
使用以下步驟更換磁碟,具體取決於裝置上的WAAS版本。
WAAS 4.0.5版及更低版本
您應該會看到從disk00到disk01的RAID重建。
WAAS版本4.0.7至4.0.11
如果disk00發生故障,且disk01的狀態旁邊沒有星號(*)(星號表示磁碟被標籤為損壞),則表示disk00出現故障,disk01的分割槽表完好。disk01的狀態可顯示為「有問題」或其他情況。在這種情況下,更換磁碟後資料不會丟失。
使用以下步驟更換磁碟,具體取決於裝置上的WAAS版本。
WAAS 4.0.5版及更低版本
您應該會看到從disk00到disk01的RAID重建。
WAAS版本4.0.7至4.0.11
您應該會看到從disk00到disk01的RAID重建。