はじめに

この章は次のトピックで構成されています。

概要

システム ハードウェアのトラブルシューティングの成功の秘訣は、問題を特定のシステム コンポーネントのレベルまで切り分けることです。最初に、システムで行われていることとシステムで行われるべきことを比較します。起動の問題はたいてい 1 つのコンポーネントに原因があるため、システムの 1 つ 1 つのコンポーネントのトラブルシューティングを行うより、問題をサブシステムのレベルまで切り分ける方が効率的です。

用語

以下は、このトラブルシューティング ガイドの概念を理解するために不可欠な用語のリストです。

用語 定義
[CPU] 中央処理装置。CISC (複合命令セット コンピュータ)と RISC(縮小命令セット コンピュータ)の両方のプロセッサに共通の参照
FHHL PCIe カード フォーム ファクタ、フル ハイト ハーフ レングス
GPU グラフィック処理ユニット
NIC ネットワーク インターフェイス カード
NVMe 不揮発性メモリ Express
OCP Open Compute Project
PCIe Peripheral Component Interconnect Express PCISIG 標準本文内で定義されているような通信を指します。
BMC ベースボード管理コントローラ
FRU 現場交換ユニット
DCSCM データセンター セキュア制御モジュールの仕様
IPMI インテリジェント プラットフォーム管理インターフェイス

初回電源投入

最初の電源投入に関する問題は、多くの場合、モジュールがバックプレーンにしっかり接続されていない、あるいは、電源モジュールが電源コード コネクタから外れていることが原因で発生します。

また、過熱が原因でシステムに問題が発生することもありますが、通常はシステムが長時間動作した後で発生します。最も一般的な過熱の原因は、ファン モジュールの障害です。

トラブルシューティングのガイドライン

C シリーズ ラックマウント サーバーまたはそのコンポーネントに関する問題をトラブルシュート場合は、ガイドラインに従うことを推奨します。

ガイドライン

説明

障害またはエラー メッセージのダイアログボックスおよびその他の関連領域のスクリーンショットを撮ります。

これらのスクリーンショットは、問題が発生したときの C シリーズ サーバの状態を視覚的に把握するのに役立ちます。スクリーンショットを作成するソフトウェアがコンピュータにない場合は、この機能が含まれている可能性があるため、オペレーティング システムのマニュアルを確認してください。

問題が発生する直前に行った手順を記録します。

画面またはキー ストロークの記録ソフトウェアにアクセスできる場合は、行った手順を繰り返し、何が起こったかを記録してください。

この種のソフトウェアにアクセスできない場合は、上記の手順を繰り返し、手順と各手順後に何が起こるかについて詳細なメモを作成してください。

show tech-support コマンドを入力します

サーバーの現在の状態に関する情報は、Cisco Technical Assistance Center (TAC) (TAC)にとって非常に役立ち、問題の原因を特定するために必要な情報として頻繁に得られます。

Cisco UCS C シリーズ ラック サーバー ファミリのほとんどのシャーシに次のサブシステムが含まれています。

  • 電源装置:電源ファンが含まれます。

  • ファン モジュール:シャーシのファン モジュールは、システム電源がオンのときは必ず作動していなければなりません。ファン LED がグリーンに点灯していて、ファン トレイ アセンブリの作動音が聞こえることを確認します。ファン LED が赤の場合、ファン モジュールの 1 つ以上のファンが動作していないことを示しています。すぐにカスタマー サービス担当者に連絡してください。


(注)  


初回の起動時にファン モジュールが機能しない場合、ユーザー側で可能なインストールの調整はありません。