统一计算 : Cisco UCS C200 M1 ?????????

UCS C系列服务器故障排除提示

2015 年 8 月 28 日 - 机器翻译
其他版本: PDFpdf | 英语 (2015 年 4 月 22 日) | 反馈


目录


简介

思科集成管理控制器(CIMC)是UCS C系列服务器的管理服务。CIMC 在服务器中运行。

您可使用基于 Web 的 GUI 或基于 SSH 的 CLI 访问、配置、管理和监控服务器。几乎所有任务可以在任何一个接口执行。在一个接口执行的任务结果在别的自动地显示。

本文为UCS C系列服务器提供一些CIMC故障排除提示和普遍的故障排除情况。

先决条件

要求

Cisco推荐您:

  • 了解 Cisco UCS C 系列服务器刀片硬件和软件管理的工作知识。

  • 熟悉UCS C系列服务器思科集成管理控制器。

  • 了解在本文描述的不同的指令的影响和涵义。

  • 熟悉UCS组成部分和拓扑。

使用的组件

本文档中的信息基于 Cisco UCS C 系列服务器。

本文档中的信息都是基于特定实验室环境中的设备编写的。用于本文的所有设备都始于默认配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

网络图

当前没有可用的特定网络图。

规则

有关文档规则的详细信息,请参阅 Cisco 技术提示规则

背景信息

当前没有可用的特定背景信息。

C系列故障排除提示

在C系列服务器的普通的故障排除提示在此部分提供。

获取对TAC的Showtech支持

由Cisco技术支持中心(TAC)执行此任务,当请求的。此工具创建包含配置信息、将帮助在故障排除和解决技术问题的TAC的日志和诊断数据的汇总报告。

此showtechsupport从GUI和CLI是可得到对tftp加载techsupport文件为脱机分析。完成这些步骤为了通过GUI获取showtech :

  1. 在导航窗格中,请点击Admin选项卡。

  2. 从Admin选项卡,请点击工具

  3. 在工具窗格的操作地区中,请点击出口技术支持数据

    tshoot-tips-cimc-01.gif

  4. 在出口技术支持数据对话框中,请填入这些字段:

    • TFTP服务器IP地址字段-支持Data文件应该存储TFTP server的IP地址。

    • 路径和Filename字段-支持数据在服务器应该存储的文件名。当您输入此名称时,请从TFTP树的顶端包括文件的相对路径对所需位置。

  5. 点击出口

    tshoot-tips-cimc-02.gif

    并且通过CLI命令:

    generate显示techsupport
    Generate show techsupport then provide the generated report file to Cisco TAC.
    SanDiego# scope cimc
    SanDiego /cimc # scope
      firmware
      log
      network
      tech-support
    
    SanDiego /cimc # scope tech-support
    SanDiego /cimc/tech-support # set tftp-ip 192.168.1.1
    SanDiego /cimc/tech-support *# set path \techsupport\showtech
    SanDiego /cimc/tech-support *#commit
    SanDiego /cimc/tech-support *#start

    这些是某些的说明在showtech内的密钥字段:

    • var/- contains选派了所有受监视服务日志和状况。它也包含服务信息文件例如SOL和IPMI传感器的配置报警。

    • var/日志-这包含最近挥发性日志消息。

    • obfl/-这包含最近非易变日志消息。

    • 见面-非易失性配置和SEL。

    • tmp/-显示techsupport文本文件,与BIOS techsupport文本文件一起。

    • 在tmp的文本文件-这些包含所有进程、网络、系统、中楼和生物活素状态信息。

    • mctool -有关于状态的基本信息CIMC USC管理API。

    • 网络-请参阅当前网络配置和socket信息。

    • obfl - Live obfl

    • 消息- Live /var/log/messages文件

    • 报警-什么传感器在报警。

    • 传感器-从IPMI的当前传感器读。

    • 电源x86的当前电源状态。

显示系统事件日志事件

完成这些步骤为了显示系统事件日志(SEL)事件:

  1. 在导航窗格中,请点击Server选项

  2. 从Server选项,请点击系统事件日志

  3. 查看每个系统事件的以下信息在日志。

  4. (可选)从条目每张页下拉列表,请选择系统事件数量显示在每个页。

  5. (可选)请点击<Newer和Older>通过系统事件页来回地移动或者单击<<Newest搬到列表的顶部。默认情况下,最新的系统事件在顶部显示,如果列表。思科CIMC。

    tshoot-tips-cimc-03.gif

显示传感器读

完成这些步骤为了显示传感器读:

  1. 在导航窗格中,请点击Server选项

  2. 从Server选项,请点击传感器

  3. 通过单击希望的传感器查看多种传感器。

    tshoot-tips-cimc-04.gif

显示CIMC日志

完成这些步骤为了显示CIMC日志:

  1. 在导航窗格中,请点击Admin选项卡。

  2. 从Admin选项卡,请点击CIMC日志

  3. 从条目每张页下拉列表,请选择CIMC事件数量显示在每个页。

    tshoot-tips-cimc-05.gif

运行调试固件工具(CLI)

您能运行调试固件工具(CLI)查看实时CIMC调试状态:

对查看实时CIMC调试状态的只读shell的访问。

CIMC调试工具

!--- enter debug shell

rtp-6100-A#
SanDiego /cimc # connect
  debug-shell
  diags
  host
  shell

SanDiego /cimc # connect debug-shell
  <CR>

SanDiego /cimc # connect debug-shell
BMC Debug Firmware Utility Shell
[ help ]#

!--- available debug options



[ help ]# ?
__________________________________________
          Debug Firmware Utility
__________________________________________
Command List
__________________________________________

alarms
cores
exit
help [COMMAND]
images
mctools
memory
messages
network
obfl
post
power
sensors
sel
fru
tasks
top
update
users
version

__________________________________________
 Notes:
"enter Key" will execute last command
"COMMAND ?" will execute help for that command
__________________________________________
[ help ]#

!--- view how many alarms in realtime

[ help ]# alarms
  StatusLedControl: Setting LED to AMBER
   - Sensor[176] in ALARM Level[2]
[ alarms ]#

!--- view all sensors in realtime

[ alarms ]# sensors
P3V_BAT_SCALED   | 3.023      | Volts      | ok    | 2.706     | 2.798     | na        | na        | 3.089     | na
P12V_SCALED      | 12.036     | Volts      | ok    | 11.269    | 11.623    | na        | na        | 12.331    | 12.685
P5V_SCALED       | 5.037      | Volts      | ok    | 4.675     | 4.844     | na        | na        | 5.157     | 5.278
P3V3_SCALED      | 3.302      | Volts      | ok    | 3.097     | 3.192     | na        | na        | 3.381     | 3.492
P5V_STBY_SCALED  | 4.989      | Volts      | ok    | 4.675     | 4.844     | na        | na        | 5.157     | 5.278
VR_CPU1_IOUT     | 10.680     | Amps       | ok    | na        | na        | na        | 152.680   | 164.040   | 175.400
VR_CPU2_IOUT     | 12.100     | Amps       | ok    | na        | na        | na        | 152.680   | 164.040   | 175.400
PV_VCCP_CPU1     | 0.862      | Volts      | ok    | 0.706     | 0.725     | na        | na        | 1.392     | 1.431
PV_VCCP_CPU2     | 0.862      | Volts      | ok    | 0.706     | 0.725     | na        | na        | 1.392     | 1.431
P1V5_DDR3_CPU1   | 1.499      | Volts      | ok    | 1.411     | 1.450     | na        | na        | 1.548     | 1.588
P1V5_DDR3_CPU2   | 1.499      | Volts      | ok    | 1.411     | 1.450     | na        | na        | 1.548     | 1.588
P1V1_IOH         | 1.088      | Volts      | ok    | 1.029     | 1.068     | na        | na        | 1.137     | 1.166
P1V8_AUX         | 1.784      | Volts      | ok    | 1.695     | 1.744     | na        | na        | 1.852     | 1.911
IOH_THERMALERT_N | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
IOH_THERMTRIP_N  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
P2_THERMTRIP_N   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
P1_THERMTRIP_N   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na


!--- view power status in realtime

[ help ]# power
OP:[ status ]
Power-State:         [ on ]
VDD-Power-Good:      [ active ]
Power-On-Fail:       [ inactive ]
Power-Ctrl-Lock:     [ unlocked ]
OP-CCODE:[ Success ]
[ power ]#


!--- view network status in realtime

[ power ]# network
eth1      Link encap:Ethernet  HWaddr 02:44:67:84:09:1C
          inet addr:172.25.183.109  Bcast:172.25.183.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:42862 errors:0 dropped:0 overruns:0 frame:0
          TX packets:26968 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:3786646 (3.6 MiB)  TX bytes:12311980 (11.7 MiB)
          Interrupt:1

lo        Link encap:Local Loopback
          inet addr:127.0.0.1  Mask:255.255.0.0
          UP LOOPBACK RUNNING  MTU:16436  Metric:1
          RX packets:8137 errors:0 dropped:0 overruns:0 frame:0
          TX packets:8137 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:0
          RX bytes:877033 (856.4 KiB)  TX bytes:877033 (856.4 KiB)

Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:3490            0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8195          0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:2068            0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:23              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:443             0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8195          127.0.0.1:2360          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2361          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2353          ESTABLISHED
tcp        0      0 127.0.0.1:2363          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2360          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2361          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2367          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2354          ESTABLISHED
tcp        0      0 127.0.0.1:2354          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2355          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2353          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2358          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2359          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2356          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2357          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2363          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2355          ESTABLISHED
tcp        0   4412 172.25.183.109:22       10.61.100.118:2632      ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2356          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2357          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2358          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2367          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2359          ESTABLISHED
netstat: no support for 'AF INET6 (tcp)' on this system
udp        0      0 127.0.0.1:9473          0.0.0.0:*
udp        0      0 0.0.0.0:623             0.0.0.0:*
netstat: no support for 'AF INET6 (udp)' on this system
netstat: no support for 'AF INET6 (raw)' on this system
Active UNIX domain sockets (servers and established)
Proto RefCnt Flags       Type       State         I-Node Path
unix  2      [ ACC ]     STREAM     LISTENING     3330   /tmp/rpSocketCB25226
unix  2      [ ACC ]     STREAM     LISTENING     2112   /var/split_stream_RW
unix  2      [ ACC ]     STREAM     LISTENING     2114   /var/split_stream_RO
unix  2      [ ACC ]     STREAM     LISTENING     4437   /tmp/rpSocketSMCB536870913
unix  2      [ ACC ]     STREAM     LISTENING     2903   /tmp/rpSocket35003

运行诊断(CLI)

您能运行诊断(CLI)诊断可能的问题。

注意: 不应该以您不能丢失的负载运行诊断,当设计是安全对运行服务器时。请保证重要服务器服务器应用在运行诊断前是脱机。

诊断(CLI)

  • 查看实时CIMC诊断状态。

    CIMC Diag Shell
    
    !--- Enter diagnostics mode.
    
    SanDiego# connect
      debug-shell
      diags
      host
      shell
    
    SanDiego# connect diags
      <CR>
    
    SanDiego# connect diags
    Diagnostics while designed to be safe to a running server should not
    be run with a load you cannot afford to lose. Please ensure critical
    server applications are off-line before running diagnostics.
    Continue?[y|N]y
     max_slots = 1
    Registering hwmon commands
    dsh_cmd_add: Adding hwmon 0x32658
    Registering board commands
    dsh_cmd_add: Adding sprom 0x129a8
    dsh_cmd_add: Adding i2c 0x12a14
    dsh_cmd_add: Adding spd 0x12db8
    dsh_cmd_add: Adding tmp75 0x12c88
    dsh_cmd_add: Adding clkbuf 0x132e4
    dsh_cmd_add: Adding timhub 0x13368
    dsh_cmd_add: Adding help 0x10778
    dsh_cmd_add: Adding show 0x108f4
    dsh_cmd_add: Adding run 0x108a0
    dsh_cmd_add: Adding skip 0x10b2c
    dsh_cmd_add: Adding unskip 0x10b64
    dsh_cmd_add: Adding results 0x10b9c
    dsh_cmd_add: Adding sp 0x10ce8
    dsh_cmd_add: Adding reg 0x10db0
    dsh_cmd_add: Adding version 0x10de8
    dsh_cmd_add: Adding err 0x10e24
    DIAG >
    DIAG > q
    SanDiego#

普遍的故障排除情况-接通电源涉及

  • 对UCS C250 M1已扩展内存机架装置服务器的没有备用电源

    1. 检查AC电源线是好的。

    2. 电源部件的失败。

  • 服务器主机不启动

    1. 检查前面输入输出板连接。

    2. 检查电源顺序器故障LED。

    3. 电源部件失败(PS闪烁失败的LED)。

  • 服务器启动没有视频

    1. 检查前面I/O Dongle适当地供以座位。

    2. 检查对主板的前面I/O电缆连接。

    3. 内存子系统失败。

  • BMC不启动

    1. 备用电源铁路运输的失败。

    2. 损坏的BMC BIOS。

普遍的故障排除情况-主机不启动

检查:

  1. 验证前面I/O Dongle正确地装置。

  2. 检查前面I/O电缆连接。

  3. 重新安装/替换Dimm。

  4. 验证BIOS不损坏。

  5. 验证电源轨是好的主机。

  6. 检查CPU插槽管脚。

  7. 验证信号是好的Powerok。

  8. 验证重置是好。

普遍的故障排除情况- BMC

启动的BMC。寻找刀片健康LED来在哪些表明BMC开始。

  1. 检查备用电源铁路运输是好的。

  2. 检查BMC生物活素不损坏。

  3. 检查BMC时钟是好的。

  4. 检查备用电源是ok,并且重置有效。

BMC以太网不能通信

检查对主板的弹性电缆连接并且抚养I/O。

验证

参考验证的上述小节。

故障排除

目前没有针对此配置的故障排除信息。

相关的思科支持社区讨论

思科支持社区是您提问、解答问题、分享建议以及与工作伙伴协作的论坛。


相关信息


Document ID: 111508