サーバ - ユニファイド コンピューティング : Cisco UCS C シリーズ ラック サーバ

UCS C シリーズ サーバのトラブルシューティングのヒント

2012 年 12 月 18 日 - ライター翻訳版
その他のバージョン: PDFpdf | 機械翻訳版 (2013 年 8 月 21 日) | 英語版 (2010 年 1 月 8 日) | フィードバック

UCS C シリーズ サーバのトラブルシューティングのヒント

概要

Cisco Integrated Management Controller(CIMC)は、UCS C シリーズ サーバ用の管理サービスです。CIMC は、サーバ内で実行されます。

Web ベースの GUI または SSH ベースの CLI を使用して、サーバにアクセスし、サーバを設定、管理、モニタできます。これらのいずれかのインターフェイスで、ほぼすべてのタスクを実行できます。一方のインターフェイスで実行されるタスクの結果は、もう一方のインターフェイスでも自動的に表示されます。

このドキュメントでは、CIMC のトラブルシューティングのヒントおよび UCS C シリーズ サーバの共通のトラブルシューティング シナリオについて説明します。

前提条件

要件

シスコでは次を推奨しています。

  • Cisco UCS C シリーズ サーバ ブレードのソフトウェアおよびハードウェアの管理に関する実務知識があること。

  • UCS C シリーズ サーバの Cisco Integrated Management Controller に精通していること。

  • このドキュメントで説明されているさまざまなコマンドの影響と意味を理解していること。

  • UCS のコンポーネントとトポロジに精通していること。

使用するコンポーネント

このドキュメントの情報は、Cisco UCS C シリーズ サーバのシステムに基づくものです。

このドキュメントの情報は、特定のラボ環境にあるデバイスに基づいて作成されたものです。このドキュメントで使用するすべてのデバイスは、クリアな(デフォルト)設定で作業を開始しています。ネットワークが稼働中の場合は、コマンドが及ぼす潜在的な影響を十分に理解しておく必要があります。

ネットワーク ダイアグラム

現在のところ、使用可能な固有のネットワーク図はありません。

表記法

ドキュメント表記の詳細は、『シスコ テクニカル ティップスの表記法』を参照してください。

背景説明

現在のところ、特定の背景情報はありません。

C シリーズのトラブルシューティングのヒント

このセクションでは、C シリーズ サーバの共通のトラブルシューティングのヒントについて説明します。

TAC への Showtech サポートの取得

このタスクは、Cisco Technical Assistance Center(TAC)から要求された場合に実行します。このユーティリティは、TAC が技術上の問題をトラブルシューティングおよび解決する際に役立つ設定情報、ログ、および診断データが含まれる要約レポートを作成します。

この Showtech サポートは、GUI および CLI から使用でき、テクニカル サポート ファイルを tftp アップロードしてオフラインで分析できます。GUI を介して Showtech を取得するには、次の手順を実行します。

  1. ナビゲーション ペインで [Admin] タブをクリックします。

  2. [Admin] タブの [Utilities] をクリックします。

  3. [Utilities] ペインの [Actions] 領域で、[Export Technical Support Data] をクリックします。

    tshoot-tips-cimc-01.gif

  4. [Export Technical Support Data] ダイアログボックスで、次のフィールドに入力します。

    • [TFTP Server IP Address] フィールド:サポート データ ファイルを保存する TFTP サーバの IP アドレス。

    • [Path and Filename] フィールド:サポート データをサーバに保存するときのファイル名。この名前を入力するときは、ファイルの相対パスを、TFTP ツリーの最上位から目的の場所まで含めてください。

  5. [Export] をクリックします。

    tshoot-tips-cimc-02.gif

    CLI コマンドを使用する場合:

    Generate show techsupport
    Generate show techsupport then provide the generated report file to Cisco TAC.
    SanDiego# scope cimc
    SanDiego /cimc # scope
      firmware
      log
      network
      tech-support
    
    SanDiego /cimc # scope tech-support
    SanDiego /cimc/tech-support # set tftp-ip 192.168.1.1
    SanDiego /cimc/tech-support *# set path \techsupport\showtech
    SanDiego /cimc/tech-support *#commit
    SanDiego /cimc/tech-support *#start

    次に、showtech 内のいくつかのキー フィールドについて説明します。

    • var/:詳細ログおよびモニタされるすべてのサービスのステータスを含みます。また、SOL および IPMI センサー アラームの設定など、サービス情報ファイルも含みます。

    • var/log:ローリング揮発性ログ メッセージを含みます。

    • obfl/:ローリング非揮発性ログ メッセージを含みます。

    • met/:非揮発性設定および SEL。

    • tmp/:show techsupport テキストファイルおよび BIOS techsupport テキスト ファイル。

    • tmp のテキスト ファイル:すべてのプロセス、ネットワーク、システム、mezzanine および bios ステート情報を含みます。

    • mctool:CIMC から USC 管理 API の状態の基本情報を取得します。

    • network:現在のネットワーク構成およびソケット情報を示します。

    • obfl:ライブ obfl。

    • messages:ライブ /var/log/messages ファイル。

    • alarms:アラームのセンサー。

    • sensors:IPMI の現在のセンサーの読み取り。

    • power:x86 の現在の電力状態。

システム イベント ログ イベントの表示

システム イベント ログ(SEL)イベントを表示するには、次の手順を実行します。

  1. [Navigation] ペインの [Server] タブをクリックします。

  2. [Server] タブの [System Event Log] をクリックします。

  3. ログのシステム イベントごとに次の情報を確認します。

  4. (オプション)[Entries Per Page] ドロップダウン リストから、各ページに表示するシステム イベントの数を選択します。

  5. (オプション)システム イベントのページを前方および後方に移動するには [<Newer] および [Older>] をクリックし、リストの先頭に移動するには [<<Newest] をクリックします。デフォルトでは、最新のシステム イベントがリストの先頭に表示されます。Cisco CIMC:

    tshoot-tips-cimc-03.gif

センサーの読み取りの表示

センサーの読み取りを表示するには、次の手順を実行します。

  1. [Navigation] ペインの [Server] タブをクリックします。

  2. [Server] タブの [Sensors] をクリックします。

  3. 目的のセンサーをクリックして、各センサーを表示します。

    tshoot-tips-cimc-04.gif

CIMC ログの表示

CIMC ログを表示するには、次の手順を実行します。

  1. ナビゲーション ペインで [Admin] タブをクリックします。

  2. [Admin] タブの [CIMC Log] をクリックします。

  3. [Entries Per Page] ドロップダウン リストから、各ページに表示する CIMC イベントの数を選択します。

    tshoot-tips-cimc-05.gif

Debug Firmware Utility の実行(CLI)

Debug Firmware Utility(CLI)を実行して、リアルタイムの CIMC デバッグ ステータスを表示できます。

読み取り専用のシェルにアクセスし、リアルタイムの CIMC デバッグ ステータスを表示します。

CIMC デバッグ ユーティリティ

!--- デバッグ シェルを開始します

rtp-6100-A#
SanDiego /cimc # connect
  debug-shell
  diags
  host
  shell

SanDiego /cimc # connect debug-shell
  <CR>

SanDiego /cimc # connect debug-shell
BMC Debug Firmware Utility Shell
[ help ]#

!--- 使用可能なデバッグ オプション



[ help ]# ?
__________________________________________
          Debug Firmware Utility
__________________________________________
Command List
__________________________________________

alarms
cores
exit
help [COMMAND]
images
mctools
memory
messages
network
obfl
post
power
sensors
sel
fru
tasks
top
update
users
version

__________________________________________
 Notes:
"enter Key" will execute last command
"COMMAND ?" will execute help for that command
__________________________________________
[ help ]#

!--- リアルタイムのアラーム数を表示します

[ help ]# alarms
  StatusLedControl: Setting LED to AMBER
   - Sensor[176] in ALARM Level[2]
[ alarms ]#

!--- リアルタイムのすべてのセンサーを表示します

[ alarms ]# sensors
P3V_BAT_SCALED   | 3.023      | Volts      | ok    | 2.706     | 2.798     | na        | na        | 3.089     | na
P12V_SCALED      | 12.036     | Volts      | ok    | 11.269    | 11.623    | na        | na        | 12.331    | 12.685
P5V_SCALED       | 5.037      | Volts      | ok    | 4.675     | 4.844     | na        | na        | 5.157     | 5.278
P3V3_SCALED      | 3.302      | Volts      | ok    | 3.097     | 3.192     | na        | na        | 3.381     | 3.492
P5V_STBY_SCALED  | 4.989      | Volts      | ok    | 4.675     | 4.844     | na        | na        | 5.157     | 5.278
VR_CPU1_IOUT     | 10.680     | Amps       | ok    | na        | na        | na        | 152.680   | 164.040   | 175.400
VR_CPU2_IOUT     | 12.100     | Amps       | ok    | na        | na        | na        | 152.680   | 164.040   | 175.400
PV_VCCP_CPU1     | 0.862      | Volts      | ok    | 0.706     | 0.725     | na        | na        | 1.392     | 1.431
PV_VCCP_CPU2     | 0.862      | Volts      | ok    | 0.706     | 0.725     | na        | na        | 1.392     | 1.431
P1V5_DDR3_CPU1   | 1.499      | Volts      | ok    | 1.411     | 1.450     | na        | na        | 1.548     | 1.588
P1V5_DDR3_CPU2   | 1.499      | Volts      | ok    | 1.411     | 1.450     | na        | na        | 1.548     | 1.588
P1V1_IOH         | 1.088      | Volts      | ok    | 1.029     | 1.068     | na        | na        | 1.137     | 1.166
P1V8_AUX         | 1.784      | Volts      | ok    | 1.695     | 1.744     | na        | na        | 1.852     | 1.911
IOH_THERMALERT_N | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
IOH_THERMTRIP_N  | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
P2_THERMTRIP_N   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na
P1_THERMTRIP_N   | 0x0        | discrete   | 0x0180| na        | na        | na        | na        | na        | na


!--- リアルタイムの電力ステータスを表示します

[ help ]# power
OP:[ status ]
Power-State:         [ on ]
VDD-Power-Good:      [ active ]
Power-On-Fail:       [ inactive ]
Power-Ctrl-Lock:     [ unlocked ]
OP-CCODE:[ Success ]
[ power ]#


!--- リアルタイムのネットワーク ステータスを表示します

[ power ]# network
eth1      Link encap:Ethernet  HWaddr 02:44:67:84:09:1C
          inet addr:172.25.183.109  Bcast:172.25.183.255  Mask:255.255.255.0
          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1
          RX packets:42862 errors:0 dropped:0 overruns:0 frame:0
          TX packets:26968 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:1000
          RX bytes:3786646 (3.6 MiB)  TX bytes:12311980 (11.7 MiB)
          Interrupt:1

lo        Link encap:Local Loopback
          inet addr:127.0.0.1  Mask:255.255.0.0
          UP LOOPBACK RUNNING  MTU:16436  Metric:1
          RX packets:8137 errors:0 dropped:0 overruns:0 frame:0
          TX packets:8137 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:0
          RX bytes:877033 (856.4 KiB)  TX bytes:877033 (856.4 KiB)

Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State
tcp        0      0 0.0.0.0:3490            0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8195          0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:80              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:2068            0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:23              0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:443             0.0.0.0:*               LISTEN
tcp        0      0 127.0.0.1:8195          127.0.0.1:2360          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2361          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2353          ESTABLISHED
tcp        0      0 127.0.0.1:2363          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2360          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2361          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2367          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2354          ESTABLISHED
tcp        0      0 127.0.0.1:2354          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2355          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2353          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2358          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2359          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2356          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:2357          127.0.0.1:8195          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2363          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2355          ESTABLISHED
tcp        0   4412 172.25.183.109:22       10.61.100.118:2632      ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2356          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2357          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2358          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2367          ESTABLISHED
tcp        0      0 127.0.0.1:8195          127.0.0.1:2359          ESTABLISHED
netstat: no support for 'AF INET6 (tcp)' on this system
udp        0      0 127.0.0.1:9473          0.0.0.0:*
udp        0      0 0.0.0.0:623             0.0.0.0:*
netstat: no support for 'AF INET6 (udp)' on this system
netstat: no support for 'AF INET6 (raw)' on this system
Active UNIX domain sockets (servers and established)
Proto RefCnt Flags       Type       State         I-Node Path
unix  2      [ ACC ]     STREAM     LISTENING     3330   /tmp/rpSocketCB25226
unix  2      [ ACC ]     STREAM     LISTENING     2112   /var/split_stream_RW
unix  2      [ ACC ]     STREAM     LISTENING     2114   /var/split_stream_RO
unix  2      [ ACC ]     STREAM     LISTENING     4437   /tmp/rpSocketSMCB536870913
unix  2      [ ACC ]     STREAM     LISTENING     2903   /tmp/rpSocket35003

Diagnostics の実行(CLI)

Diagnostics(CLI)を実行して、可能性のある問題を診断します。

注:Diagnostics は、稼働サーバに対して安全ですが、許容できない負荷をかけて実行しないでください。Diagnostics を実行する前に、重要なサーバ アプリケーションがオフラインであることを確認します。

Diagnostics(CLI)

  • リアルタイム CIMC Diagnostics ステータスを表示するには、次の手順を実行します。

    CIMC Diags Shell
    
    !--- 診断モードを開始します。
    
    SanDiego# connect
      debug-shell
      diags
      host
      shell
    
    SanDiego# connect diags
      <CR>
    
    SanDiego# connect diags
    Diagnostics while designed to be safe to a running server should not
    be run with a load you cannot afford to lose. Please ensure critical
    server applications are off-line before running diagnostics.
    Continue?[y|N]y
     max_slots = 1
    Registering hwmon commands
    dsh_cmd_add: Adding hwmon 0x32658
    Registering board commands
    dsh_cmd_add: Adding sprom 0x129a8
    dsh_cmd_add: Adding i2c 0x12a14
    dsh_cmd_add: Adding spd 0x12db8
    dsh_cmd_add: Adding tmp75 0x12c88
    dsh_cmd_add: Adding clkbuf 0x132e4
    dsh_cmd_add: Adding timhub 0x13368
    dsh_cmd_add: Adding help 0x10778
    dsh_cmd_add: Adding show 0x108f4
    dsh_cmd_add: Adding run 0x108a0
    dsh_cmd_add: Adding skip 0x10b2c
    dsh_cmd_add: Adding unskip 0x10b64
    dsh_cmd_add: Adding results 0x10b9c
    dsh_cmd_add: Adding sp 0x10ce8
    dsh_cmd_add: Adding reg 0x10db0
    dsh_cmd_add: Adding version 0x10de8
    dsh_cmd_add: Adding err 0x10e24
    DIAG >
    DIAG > q
    SanDiego#

一般的なトラブルシューティング シナリオ:電源オン関連

  • No Standby Power to UCS C250 M1 拡張メモリ ラック マウント サーバのスタンバイ電源がない

    1. AC 電源コードが正常であることを確認します。

    2. 電源装置に障害が発生している可能性があります。

  • サーバ ホストが起動しない

    1. フロント I/O ボード接続を確認します。

    2. パワー シーケンサー障害 LED を確認します。

    3. 電源装置で障害が発生している可能性があります(PS 障害 LED が点滅)。

  • ビデオなしでサーバの電源がオンになる

    1. フロント I/O ドングルが正しく取り付けられていることを確認します。

    2. マザーボードへのフロント I/O ケーブル接続を確認します。

    3. メモリ サブシステム障害が発生している可能性があります。

  • BMC が起動しない

    1. スタンバイ電源レールで障害が発生している可能性があります。

    2. BMC BIOS が壊れている可能性があります。

一般的なトラブルシューティング シナリオ:ホストがブートしない

次のことを確認します。

  1. フロント I/O ドングルが正しく取り付けられていることを確認します。

  2. フロント I/O ケーブル接続を確認します。

  3. Dimm を取り付け直す、または交換します。

  4. BIOS が破損していないことを確認します。

  5. ホスト パワー レールが正しいことを確認します。

  6. CPU ソケットのピンが曲がってないか確認します。

  7. Powerok 信号が正常か確認します。

  8. リセットが正常か確認します。

一般的なトラブルシューティング シナリオ:BMC

BMC が起動します。BMC が起動していることを示すブレード ヘルス LED を確認します。

  1. スタンバイ パワー レールが正常か確認します。

  2. BMC bios が破損していないことを確認します。

  3. BMC クロックが正常であることを確認します。

  4. スタンバイ電源が正常で、リセットが有効であることを確認します。

BMC イーサネットが通信できない

マザーボードおよびリア I/O とのフレックス ケーブル接続を確認します。

確認

確認については前述のサブセクションを参照してください。

トラブルシューティング

現在のところ、この設定に関する特定のトラブルシューティング情報はありません。

関連するシスコ サポート コミュニティ ディスカッション

シスコ サポート コミュニティは、どなたでも投稿や回答ができる情報交換スペースです。


関連情報


Document ID: 111508