统一计算 : Cisco UCS C 系列机架式服务器

UCS C系列货架服务器排除故障的HDD问题CLI命令

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 4 月 23 日) | 反馈


目录


简介

本文描述几命令行界面(CLI)命令,以及其他故障排除技术,可帮助排除故障硬盘驱动器(HDD)问题。排除故障的HDD问题佳方法是使用LED, GUI、BIOS, LSI选项ROM/MegaRaid GUI和日志。然而,这些选项总是不是可用的。在这种情况下,您能使用CLI。

注意: 贡献用安德烈亚斯Nikas, Cisco TAC工程师。

先决条件

要求

本文档没有任何特定的要求。

使用的组件

本文档不限于特定的软件和硬件版本。

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

CLI命令

显示产品名称

注意:在本文列出的某些命令取决于,如果有一个LSI MegaRaid控制器,当不是1064/1068e LSI控制器支持所有。

输入显示PCI适配器命令为了查看产品名称。此示例显示LSI 1064e适配器。

ucs-c2xx-m1 /chassis #show pci-adapter 
Slot Vendor ID  Device ID  SubVendor ID  SubDevice ID  Product Name  
---- ---------  ---------  ------------  ------------  ------------------------ 
M    0x1000     0x0056     0x152d        0x896d        Cisco LSI 1064E Mezzan...

显示HDD状态

输入显示hdd命令为了查看HDDs的状态。

ucs-c2xx-m1 /chassis #show hdd
Name                    Status               
--------------------    -------------------- 
HDD_01_STATUS           present              
HDD_02_STATUS           absent               
HDD_03_STATUS           absent               
HDD_04_STATUS           absent

显示虚拟和物理推进状态

输入显示虚拟驱动器命令为了查看虚拟驱动器的状况。因为不要求您关闭服务器和输入BIOS查看信息,此命令是有用的。

ucs-c210-m2/chassis #scope storageadapter SLOT-5

ucs-c210-m2/chassis/storageadapter #show virtual-drive
Virtual Drive   Status              Name                   Size       RAID Level 
--------------  ------------------  ---------------------- ---------  ---------- 
0               Optimal                                    139236 MB  RAID 1
1               Degraded                                   974652 MB  RAID 5

输入显示物理驱动命令为了查看物理驱动的状况。

ucs-c210-m2 /chassis/storageadapter #show physical-drive

                                                  Predictive
Slot                                              Failure    Drive    Coerced
Number Controller Status Manufacturer Model       Count      Firmware Size      Type  
------ ---------- ------ ------------ ----------- ---------- -------- --------- ---- 
0      SLOT-5
1      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD 
2      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
3      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
4      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
5      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
6      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
7      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
9      SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD   
10     SLOT-5     online SEAGATE      ST9146852SS 0          0005     139236 MB HDD

显示可校正和无法修复的错误数量

输入显示计数器命令为了查看可校正和无法修复的错误数量。

ucs-c210-m2 /chassis/storageadapter #show error-counters 

PCI Slot SLOT-5:

    Memory Correctable Errors: 0

    Memory Uncorrectable Errors: 0

显示RAID控制器配置

输入显示HW设置命令为了查看RAID控制器配置。

ucs-c210-m2 /chassis/storageadapter #show hw-config 

PCI Slot SLOT-5:

    SAS Address 0: 500e004aaaaaaa3f

    SAS Address 1: 0000000000000000

    SAS Address 2: 0000000000000000

    SAS Address 3: 0000000000000000

    SAS Address 4: 0000000000000000

    SAS Address 5: 0000000000000000

    SAS Address 6: 0000000000000000

    SAS Address 7: 0000000000000000

    BBU Present: true

    NVRAM Present: true

    Serial Debugger Present: true

    Memory Present: true

    Flash Present: true

    Memory Size: 512 MB

    Cache Memory Size: 394 MB

    Number of Backend Ports: 8

显示HDDs编号

输入显示物理驱动计数命令为了查看HDDs编号。

ucs-c210-m2 /chassis/storageadapter #show physical-drive-count 

PCI Slot SLOT-5:

    Physical Drive Count: 9

    Critical Physical Drive Count: 0

    Failed Physical Drive Count: 0

技术支持文件

在不访问CLI情况下,您能查看技术支持文件(/tmp/tech_support)为了得到关于HDDs的状态的信息。这是摘自显示从智能平台管理接口的技术支持文件的一个部分(IPMI)传感器的HDDs :

Querying All IPMI Sensors:
Sensor Name | Reading | Unit      | Status  | LNR | LC  | LNC | UNC | UC | UNR       

HDD0_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD1_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD2_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD3_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD4_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD5_INFO   | 0x0     | discrete  | 0x2181  | na  | na  | na  | na  | na | na        
HDD6_INFO   | na      | discrete  | na      | na  | na  | na  | na  | na | na        
HDD7_INFO   | na      | discrete  | na      | na  | na  | na  | na  | na | na

这是摘自显示HDD状态的细分的技术支持文件的一个部分:

Bit[15:10] - Unused
Bit[9:8]   - Fault
Bit[7:4]   – LED Color 
Bit[3:0]   – LED State
Fault:
0x100 – On Line
0x200 - Degraded
LED Color: 
0x10 – GREEN
0x20 – AMBER
0x40 – BLUE
0x80 – RED
LED State:
0x01 – OFF
0x02 – ON
0x04 – FAST BLINK 
0x08 – SLOW BLINK

这是摘自显示HDD状态的技术支持文件的一个部分(与0x2181状态码) :

0x2181 

Fault:
0x100 --- HDD is On Line

LED Color:
0x80 --- RED

LED State:
0x01 --- OFF

备用电池单元

您有选项以一些服务器部署使用备用电池单元(BBU)。BBU是在断电期间,保护磁盘在RAID控制器的写高速缓存数据72个小时的一个智能备用电池单元。

此示例显示如何使用MegaCli为了检查BBU的状态:

bash$ sudo /opt/MegaRAID/MegaCli/MegaCli64 -AdpBbuCmd -a0 -NoLog
 Password:
 
 . . .

  Battery Replacement required            : Yes
 
 . . .
 
 Relative State of Charge: 99 %
 Absolute State of charge: 76 %
 
 . . .
 
 Date of Manufacture: 11/08, 2008
 Design Capacity: 700 mAh
 Design Voltage: 3700 mV
 Specification Info: 33
 Serial Number: 243
 Pack Stat Configuration: 0x6cb0
 Manufacture Name: LSI113000G
 Device Name: 2970700
 Device Chemistry: LION
 Battery FRU: N/A

此示例显示如何使用CLI为了检查BBU的状态:

ucs-c200-m2 /chassis/storageadapter #show bbu detail
Controller SLOT-7:
     Battery Type: iBBU
     Battery Present: true
     Voltage: 4.023 V
     Current: 0.000 A
     Charge: 100%
     Charging State: fully charged
     Temperature: 34 degrees C
     Voltage Low: false
     Temperature High: false
     Learn Cycle Requested: false
     Learn Cycle Active: false
     Learn Cycle Failed: false
     Learn Cycle Timeout: false
     I2C Errors Detected: false
     Battery Replacement Required: true
     Remaining Capacity Low: true

相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


相关信息


Document ID: 115025