この製品のマニュアルセットは、偏向のない言語を使用するように配慮されています。このマニュアルセットでの偏向のない言語とは、年齢、障害、性別、人種的アイデンティティ、民族的アイデンティティ、性的指向、社会経済的地位、およびインターセクショナリティに基づく差別を意味しない言語として定義されています。製品ソフトウェアのユーザーインターフェイスにハードコードされている言語、RFP のドキュメントに基づいて使用されている言語、または参照されているサードパーティ製品で使用されている言語によりドキュメントに例外が存在する場合があります。シスコのインクルーシブランゲージに対する取り組みの詳細は、こちらをご覧ください。
このドキュメントは、米国シスコ発行ドキュメントの参考和訳です。リンク情報につきましては、日本語版掲載時点で、英語版にアップデートがあり、リンク先のページが移動/変更されている場合がありますことをご了承ください。あくまでも参考和訳となりますので、正式な内容については米国サイトのドキュメントを参照ください。
メッセージを送信するよう Call Home を設定すると、Cisco UCS Manager は CLI(コマンド ライン インターフェイス)の適切な show コマンドを実行し、そのコマンドの出力をメッセージに添付します。
Cisco UCS では、Call Home メッセージが次のフォーマットで配信されます。
Smart Call Home が Cisco UCS で設定されている場合、このセクションに記載されているすべての障害によって Cisco Smart Call Home システムに対する Smart Call Home イベントが発生します。
(注) Call Home のアラートが発生するすべての Cisco UCS Manager 障害は、「UCS 障害の概要」に記載されています。Call Home アラートの種類が各障害の「障害の詳細」の CallHome に含まれています。
Call Home の障害についての詳細情報は、『Monitoring Details for Cisco SMARTnet Service with Smart Call Home』の「Unified Computing System (UCS)」でも参照できます。
この項では、Call Home アラートの原因となった Cisco UCS Manager 以外のコンポーネントによって生成されたすべての障害を説明し、次の項目を記載しています。
この障害は通常、1 つ以上のポートが電源投入時セルフテストまたはランタイム モニタリング中にこの診断テスト失敗したために発生します。その結果、Cisco UCS Manager は影響を受けるポートをシャットダウンします。障害が発生したポートに接続されているデバイスのネットワーク接続が影響を受けます。
手順 1 障害が発生したポートが拡張モジュールにある場合は、モジュールをいったん取り外して取り付け直します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
手順 2 SFP または SFP+ をいったん取り外して取り付け直し、SFP または SFP+ が適切に装着されていることを確認します。
手順 3 現用ポートに障害が疑われる SFP または SFP+ を挿入します。現用ポートに障害が発生した場合、SFP または SFP+ が故障しています。故障した SFP または SFP+ を交換することを検討してください。
手順 4 SFP または SFP+ が動作する場合、モジュールのハードウェアが故障しています。
a. 固定モジュールが影響を受ける場合、ファブリック インターコネクトを交換することを検討してください。
b. 拡張モジュールが影響を受ける場合、問題のあるモジュールを交換することを検討してください。
ハードウェアを交換するために、Cisco UCS インスタンスのダウンタイムのスケジュールを設定します。
1 つ以上のポートが、電源投入時セルフテストまたはランタイム モニタリング中にこの診断テストに合格しませんでした。その結果、Cisco UCS Manager は影響を受けるポートをシャットダウンします。障害が発生したポートに接続されているデバイスのネットワーク接続が影響を受けます。
手順 1 障害が発生したポートが拡張モジュールにある場合は、モジュールをいったん取り外して取り付け直します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
手順 2 SFP または SFP+ をいったん取り外して取り付け直し、SFP または SFP+ が適切に装着されていることを確認します。
手順 3 現用ポートに障害が疑われる SFP または SFP+ を挿入します。現用ポートに障害が発生した場合、SFP または SFP+ が故障しています。故障した SFP または SFP+ を交換することを検討してください。
手順 4 SFP または SFP+ が動作する場合、モジュールのハードウェアが故障しています。
a. 固定モジュールが影響を受ける場合、ファブリック インターコネクトを交換することを検討してください。
b. 拡張モジュールが影響を受ける場合、問題のあるモジュールを交換することを検討してください。
ハードウェアを交換するために、Cisco UCS インスタンスのダウンタイムのスケジュールを設定します。
1 つ以上のポートが、電源投入時セルフテストまたはランタイム モニタリング中にこの診断テストに合格しませんでした。その結果、Cisco UCS Manager は影響を受けるポートをシャットダウンし、障害が発生したポートに接続されているデバイスのネットワーク接続が影響を受けます。
手順 1 障害が発生したポートが拡張モジュールにある場合は、モジュールをいったん取り外して取り付け直します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
手順 2 SFP または SFP+ をいったん取り外して取り付け直し、SFP または SFP+ が適切に装着されていることを確認します。
手順 3 現用ポートに障害が疑われる SFP または SFP+ を挿入します。現用ポートに障害が発生した場合、SFP または SFP+ が故障しています。故障した SFP または SFP+ を交換することを検討してください。
手順 4 SFP または SFP+ が動作する場合、モジュールのハードウェアが故障しています。
a. 固定モジュールが影響を受ける場合、ファブリック インターコネクトを交換することを検討してください。
b. 拡張モジュールが影響を受ける場合、問題のあるモジュールを交換することを検討してください。
ハードウェアを交換するために、Cisco UCS インスタンスのダウンタイムのスケジュールを設定します。
1 つ以上のポートが、電源投入時セルフテストまたはランタイム モニタリング中にこの診断テストに合格しませんでした。その結果、Cisco UCS Manager は影響を受けるポートをシャットダウンします。障害が発生したポートに接続されているデバイスのネットワーク接続が影響を受けます。
手順 1 影響を受けるポートに接続されたデバイスを、ファブリック インターコネクトの別の機能するポート、または別のファブリック インターコネクトに移動します。
手順 2 障害が発生したポートが拡張モジュールに存在する場合は、次の手順を実行します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
b. 問題が解決せず、すべてのポートがファブリック インターコネクトで動作することが必要な場合は、ダウンタイムをスケジュールし、拡張モジュールを交換します。
手順 3 障害が発生したポートが固定モジュールにあり、すべてのポートがファブリック インターコネクトで動作することが必要な場合は、ダウンタイムをスケジュール設定し、ファブリック インターコネクトを交換します。
この障害は通常、ファブリック インターコネクトへのインバンド接続が失敗しているために発生します。ファブリック インターコネクトは、サーバ、LAN スイッチ、SAN スイッチなどのピアに接続するためにコントロール プレーン プロトコルのインバンド接続を使用します。これらのコントロール プレーン プロトコルの例として、DCX、STP、LACP、および FSPF が含まれます。ファブリック インターコネクトは適切なコントロール プレーン プロトコルを実行できない場合、機能しなくなり、Cisco UCS Manager はファブリック インターコネクト上のすべてのポートをトポロジの問題を回避するためにシャットダウンします。
この障害は通常、ファブリック ASIC が重大な障害を報告したために発生します。すべてのポート間の接続はファブリック ASIC によって異なります。したがって、Cisco UCS Manager はファブリック インターコネクトのすべてのポートをシャットダウンします。
この障害は通常、モジュール タイプが不明であるため、影響を受けたモジュールを Cisco UCS Manager でオンラインにすることができない場合に発生します。拡張モジュールでは、Cisco UCS Manager はモジュール SPROM に保存されている情報からモジュール タイプを決定します。このエラーが表示された場合は、SPROM の内容のチェックサムの計算が失敗した可能性があります。
この障害は、拡張モジュールだけに発生します。これは固定モジュール上では発生しません。
手順 1 影響を受けるポートに接続されたデバイスを、ファブリック インターコネクトの別の機能するポート、または別のファブリック インターコネクトに移動します。
手順 2 モジュールをいったん取り外して取り付け直し、すべてのピンがバックプレーンに正しく接触していることを確認します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
手順 3 複数回再挿入しても問題が解決しない場合は、ダウンタイムをスケジュール設定し、問題のあるモジュールを交換します。
この障害は通常、オンボード障害ロギング(OBFL)のフラッシュが失敗したために発生します。Cisco UCS Managerはこのフラッシュ コンポーネントにハードウェア障害メッセージを記録します。そのロギング機能は失われます。ただし、syslog などの他のログは影響を受けず、引き続き正常に機能できます。
この障害は、ファブリック インターコネクトの通常の動作には影響しません。障害は固定モジュール上でのみ発生する可能性があります。拡張モジュール上では発生しません。
コンソールまたはシステム ログに出力されたエラー メッセージをそのままコピーします。 http://www.cisco.com/tac で提供されているツールやユーティリティを使用して問題を調べ、解決してください。『Release Notes for Cisco UCS Manager』および『Cisco UCS Troubleshooting Guide』も参照してください。問題を解決できない場合は、show tech-support コマンドを実行し、シスコのテクニカル サポートにご連絡ください。
この障害は通常、Cisco UCS Manager がモジュールの LED 制御にアクセスできない場合に発生します。ただし、LED 制御がモジュール上のその他の主要コンポーネントを制御する同じトランスポート メカニズムを使用するため、この障害は、他の失敗を示すことがあります。この障害は、モジュールまたはファブリック インターコネクトの曲がったピンが原因で発生する可能性があります。
この障害は、拡張モジュールだけに発生します。これは固定モジュール上では発生しません。
手順 1 影響を受けるポートに接続されたデバイスを、ファブリック インターコネクトの別の機能するポート、または別のファブリック インターコネクトに移動します。
手順 2 モジュールをいったん取り外して取り付け直し、すべてのピンがバックプレーンに正しく接触していることを確認します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
手順 3 この障害が再挿入後も解決しない場合、同じ障害が発生するかどうかを判別するために既知の良好なファブリック インターコネクトにこのモジュールを挿入します。
手順 4 問題が解決しない場合は、ダウンタイムをスケジュール設定し、問題のあるモジュールを交換します。
この障害は通常、影響を受けるシャーシがメジャーまたはマイナーしきい値を超え、危険なほどに高温であることを温度センサーが報告したために起こります。動作温度が下がらなかった場合、システムは、永続的な損傷を避けるために、影響を受けるシャーシをシャットダウンします。シャーシは適切なレベルに温度が回復した後、電源がオンに戻ります。
各シャーシには、動作温度を維持するために最低 7 個の機能しているファンが必要です。
手順 1 障害レポートに fan_failure_found が含まれる場合は、次の手順を実行します。
a. Cisco UCS Manager CLI または Cisco UCS Manager GUI で影響を受けるファンのステータスを確認して、温度関連のアラームの原因がファン障害であるかどうかを判別します。
b. 最低 7 個のファンがシャーシに取り付けられ、正常に機能していることを確認します。
c. ファン関連の Syslog メッセージで、障害の正確な原因を確認します。たとえば、ファンが動作不能状態になっている可能性があります。
手順 2 障害レポートに temp_current >= maj_threshold or temp_current =< min_threshold が含まれる場合は、次の手順を実行します。
a. Cisco UCS Manager CLI または Cisco UCS Manager GUI で、受け入れ可能な温度および電圧パラメータを表示し、排気口または吸気口の温度がメジャーまたはマイナーしきい値に達しているかどうか、またはどの程度超過しているかを確認します。
b. シャーシが設置されている場所が設置場所のガイドラインを満たすように、次を確認します。
– 設置場所が乾燥し、清掃され、十分に換気され、空調が整っていること。
– 空調機器が正しく機能し、0 ~ 40 ℃の周囲温度を維持していること。
– シャーシが可能な限りオープン ラックに設置されていること。閉鎖型ラックに設置しなければならない場合は、ラックの換気が十分に行われるようにしてください。
– 周囲エアーフローが正常に動作するように遮断されていないこと。エアーフローが遮断または制限されている場合、吸気が熱くなりすぎて過熱状態になります。
– シャーシの通気口の周囲の隙間が少なくとも 6 インチ(15.24 cm)あること。
– シャーシが過密なラックに設置されていない、または別の装置ラックの横に直接設置されていないこと。他の機器からの熱い排気が吸気口に入り込み、過熱状態になる可能性があります。
– ラックの下部近くにある機器によって生成される熱風が上昇して、シャーシの吸気ポートに吸い込まれないこと。温風によって、過熱状態になる可能性があります。
– 他の機器からのケーブルがシャーシのエアーフローを妨害しなこと。また、電源やカードへのアクセスの障害にならないこと。装置のメンテナンスまたはアップグレードでケーブルを不必要に切断しないように、現場交換可能なコンポーネントからケーブルを取り外します。
この障害は通常、障害が影響を受ける電源装置に記録され、影響を受けるコンポーネントが 1 台の電源装置だけを使用しているために発生します。
手順 2 電源コードが電源装置と電源に正しく接続されていることを確認します。
手順 3 ファブリック インターコネクトに 220V が供給されていることを確認します(これは、唯一のサポートされている電源構成です)。
手順 4 電源が適切に挿入され、接続されていることを確認します。
手順 5 問題が解決しない場合は、電源装置を取り外して再挿入します。
手順 6 電源のライトがまだ緑ではなく、ステータスが失敗またはシャットダウンを示し続けている場合は、問題のある電源装置を交換します。
この障害は通常、Cisco UCS Manager が温度センサーにアクセスできないために発生します。その結果、Cisco UCS Manager は影響を受けるコンポーネントの温度をモニタしたり、調整したりできません。影響を受ける温度センサーとして、シャーシ、電源、またはモジュール用があります。
手順 1 次のようにログを表示して、失敗したセンサーのセットを確認します。
手順 2 失敗したセンサーが拡張モジュールまたは電源にある場合は、次の手順を実行します。
モジュールの挿入方法については、ファブリック インターコネクトのハードウェア インストール ガイドに記載された指示に従います。
b. 複数回再挿入しても問題が続く場合は、問題のある電源装置またはモジュールを交換します。
手順 3 失敗したセンサーが固定モジュールにある場合は、シャーシの温度を調整したりモニタしたりできなくなる可能性があるため、ファブリック インターコネクトを交換します。
この障害は通常、Cisco UCS Manager が遅すぎる、または速すぎる速度で動作するファンを検出したために発生します。誤動作しているファンは、シャーシの動作温度に影響を及ぼすことがあります。
手順 1 ファンが予測速度で動作中の場合、ファン ブレードがブロックされていないことを確認します。
手順 2 ファンが予測速度を超えて動作している場合は、ファンをいったん取り外し、もう一度取り付けます。
この障害は通常、Cisco UCS Manager が複数のファンの障害を検出したために発生します。ファンの誤動作により、動作温度が高くなり、パフォーマンスに影響して、Cisco UCS Manager が影響を受けたコンポーネントをシャットダウンすることがあります。
手順 1 シャーシ ファンに障害が発生している場合は、次の手順を実行します。
b. 少なくとも 7 台のファンがインストールされ、正しく機能していることを確認します。
c. ファン関連の Syslog メッセージで、障害の正確な原因を確認します。ファンが動作不能状態になっている可能性があります。
手順 2 電源装置のファンに障害が発生していて、電源が正常に動作している場合は、次の手順を実行します。
b. 電源装置をいったん取り外して取り付け直し、ファンが動作しているかどうかを確認します。
この障害は通常、Cisco UCS Manager が 1 個のファンが欠落しているか故障したことを検出しために発生します。単一の欠落または誤動作しているファンは、パフォーマンスに影響しません。シャーシを動作可能にするには、少なくとも 7 個のファンが必要です。
手順 1 シャーシ ファンに障害が発生している場合は、次の手順を実行します。
b. 少なくとも 7 台のファンがインストールされ、正しく機能していることを確認します。
c. ファン関連の Syslog メッセージで、障害の正確な原因を確認します。ファンが動作不能状態になっている可能性があります。
手順 2 電源装置のファンに障害が発生していて、電源が正常に動作している場合は、次の手順を実行します。
b. 電源装置をいったん取り外して取り付け直し、ファンが動作しているかどうかを確認します。
影響を受ける機能用にインストールする評価ライセンスが猶予期間で動作しています。猶予期間はログに表示される日付に期限切れになり、その時点で Cisco UCS Manager が機能をディセーブルにします。詳細については、『Cisco UCS Manager CLI Configuration Guide』または『Cisco UCS Manager GUI Configuration Guide』の「Licensing」の章の指示に従います。
パフォーマンスへの影響は、影響を受ける機能が実装されているかどうかに左右されます。
この障害が発生した場合は、次のいずれかのチャネルを通して影響を受ける機能の永久ライセンスを取得します。
影響を受ける機能用にインストールされた評価ライセンスが、アラートにリストされている時間数および分数内に期限切れになります。その期間を過ぎると、Cisco UCS Manager はこの機能をディセーブルにします。詳細については、『Cisco UCS Manager CLI Configuration Guide』または『Cisco UCS Manager GUI Configuration Guide』の「Licensing」の章の指示に従います。
この障害が発生した場合は、次のいずれかのチャネルを通して影響を受ける機能の永久ライセンスを取得します。
影響を受ける機能用にインストールされている評価ライセンスの期限が切れ、Cisco UCS Manager が機能をディセーブルにしました。詳細については、『Cisco UCS Manager CLI Configuration Guide』または『Cisco UCS Manager GUI Configuration Guide』の「Licensing」の章の指示に従います。
この障害が発生した場合は、次のいずれかのチャネルを通して影響を受ける機能の永久ライセンスを取得します。
影響を受ける機能に対して以前にインストールされたライセンスがファブリック インターコネクトの設定ストレージに見つからず、Cisco UCS Manager が機能をディセーブルにしました。この問題は、フラッシュ破損などのまれな状況で発生する可能性があります。詳細については、『Cisco UCS Manager CLI Configuration Guide』または『Cisco UCS Manager GUI Configuration Guide』の「Licensing」の章の指示に従います。
Call Home は複数の Cisco 製品ラインにまたがって存在するため、独自に標準化されたプライオリティ レベルが開発されています。次の表に、基礎となる Cisco UCS の障害レベルと Call Home のプライオリティ レベルをマップする方法について説明します。
|
|
|
---|---|---|