プロセッサ関連の障害

この章は、次の項で構成されています。

fltProcessorUnitInoperable

障害コード

F0174

説明

この障害が発生すると、次のいずれかのメッセージが表示されます。

  • プロセッサ [Id] は高温のため動作不能です。冷却装置を確認してください。(Processor [Id] is inoperable due to high temperature: Check cooling.)

  • いずれかのプロセッサで壊滅的な障害が発生しました。プロセッサのステータスを確認してください。(A catastrophic fault has occurred on one of the processors: Please check the processors' status.)

  • プロセッサ [Id] は高温で動作しています。冷却装置を確認してください。(Processor [Id] is operating at a high temperature: Check cooling.)

  • PVCCD_P1_VRHOT:プロセッサ 1 は高温で動作しています。冷却装置を確認してください。(PVCCD_P1_VRHOT: Processor 1 is operating at a high temperature: Check cooling.)

  • P1_LVC3_PWRGD:PSU またはハードウェアの障害が原因で電圧レールのパワーグッドが低下しました。CISCO TAC にお問い合わせください。(P1_LVC3_PWRGD: Voltage rail Power Good dropped due to PSU or HW failure, please contact CISCO TAC for assistance.)

  • P1_MEM23_MEMHOT:プロセッサ 1 メモリ 2/3 に対応する温度センサーで熱の問題がアサートされました。冷却装置を確認してください。(P1_MEM23_MEMHOT: Temperature sensor corresponding to Processor 1 Memory 2/3 has asserted a Thermal Problem: Check server cooling.)

説明

この障害は、プロセッサに壊滅的なエラーが発生したこと、または事前設定された熱/電力しきい値を超えたことを示しています。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. 熱の問題である場合は、サーバへのエアーフローが妨げられていないかどうかを確認します。また、ヒートシンクが適切に取り付けられているかどうかを確認します。

  2. 電源または電圧の問題である場合は、電源を交換します。

  3. 問題が解決しないか、または問題の原因が機器である場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: major

原因(Cause):機器動作不能(equipment-inoperable)

mibFaultCode:174

mibFaultName:fltProcessorUnitInoperable

moClass:processor:Unit

タイプ(Type):機器(equipment)

fltProcessorUnitDisabled

障害コード

F0842

説明

プロセッサ [id] がありません。プロセッサ [id] を取り付け直すか、交換してください。(Processor [Id] missing: Please reseat or replace Processor [Id].)

説明

この障害は、プロセッサが使用不可になっていることを示しています。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. プロセッサを取り付け直します。

  2. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

重大度(Severity):情報(info)

原因(Cause):機器使用不可(equipment-disabled)

mibFaultCode:842

mibFaultName:fltProcessorUnitDisabled

moClass:processor:Unit

タイプ(Type):機器(equipment)

fltProcessorUnitThermalNonCritical

障害コード

F0175

説明

プロセッサ [Id] 熱しきい値が非重大しきい値の上限を超えました。冷却装置を確認してください。(Processor [Id] Thermal threshold has crossed upper non-critical threshold: Check cooling.)

説明

この障害は、サーバのプロセッサの温度が非重大しきい値を超えたが、まだ重大しきい値未満である場合に発生します。

考えられる要因は次のとおりです。

  • 極端な温度下では、Cisco UCS 機器の動作効率の低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

  • Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

  • CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. 製品仕様書で、サーバの動作温度範囲を確認します。

  2. 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

  3. サーバへのエアーフローがブロックされていないことを確認します。

  4. サイトの冷却システムが正常に動作していることを確認します。

  5. 設置場所を定期的にクリーニングして、ほこりやごみが堆積しないようにしてください。それらが堆積するとシステムが過熱するおそれがあります。

  6. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: minor

原因(Cause):熱の問題(thermal-problem)

mibFaultCode:175

mibFaultName:fltProcessorUnitThermalNonCritical

moClass:processor:Unit

タイプ(Type):環境(environmental)

fltProcessorUnitThermalThresholdCritical

障害コード

F0176

説明

プロセッサ [Id] 熱しきい値が重大しきい値の上限を超えました。冷却装置を確認してください。(Processor [Id] Thermal threshold has crossed upper critical threshold: Check cooling.)

説明

この障害は、ラック サーバのプロセッサの温度が重大しきい値を超えている場合に発生します。

考えられる要因は次のとおりです。

  • 極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

  • Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

  • CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. 製品仕様書で、サーバの動作温度範囲を確認します。

  2. 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

  3. サーバへのエアーフローがブロックされていないことを確認します。

  4. サイトの冷却システムが正常に動作していることを確認します。

  5. 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

  6. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: critical

原因(Cause):熱の問題(thermal-problem)

mibFaultCode:176

mibFaultName:fltProcessorUnitThermalThresholdCritical

moClass:processor:Unit

タイプ(Type):環境(environmental)

fltProcessorUnitThermalThresholdNonRecoverable

障害コード

F0177

説明

プロセッサ [Id] 熱しきい値がプリセットしきい値を超えました。冷却装置を確認してください。(Processor [Id] Thermal threshold has crossed a preset threshold: Check cooling.)

説明

この障害は、ラック サーバのプロセッサの温度が動作範囲外になっている場合に発生します。

考えられる要因は次のとおりです。

  • 極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

  • Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

  • CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. 製品仕様書で、サーバの動作温度範囲を確認します。

  2. 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

  3. サーバへのエアーフローがブロックされていないことを確認します。

  4. サイトの冷却システムが正常に動作していることを確認します。

  5. 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

  6. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

重大度(Severity):回復不能(non-recoverable)

原因(Cause):熱の問題(thermal-problem)

mibFaultCode:177

mibFaultName:fltProcessorUnitThermalThresholdNonRecoverable

moClass:processor:Unit

タイプ(Type):環境(environmental)

fltProcessorUnitVoltageThresholdCritical

障害コード

F0179

説明

この障害が発生すると、次のいずれかのメッセージが表示されます。

  • メモリ チャネル([Id])の電圧が重大しきい値の上限に達しました。(Memory channel ([Id]) voltage is upper critical.)

  • プロセッサ [Id] の電圧が重大しきい値の上限に達しました。(Processor [Id] voltage is upper critical.)

  • プロセッサ [Id] の電圧しきい値が重大しきい値の上限を超えました。電源を交換し、問題が解決したかどうかを確認してください。(Processor [Id] Voltage threshold has crossed upper critical threshold: Replace the Power Supply and verify if the issue is resolved.)それでも問題が解決されない場合は、Cisco TAC にお問い合わせください。(If the issue persists, call Cisco TAC.)

説明

この障害は、プロセッサの電圧が指定したハードウェアの電圧定格を超えた場合に発生します。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. これ以上の低下がないかどうかプロセッサをモニタします。

  2. どのしきい値を超えたかを特定するために、CPU の SEL の統計情報を確認します。

  3. 電源装置を交換してください。

    このコンポーネントを交換する前に、前提条件、安全に関する推奨事項と警告について、サーバ固有のインストレーションおよびサービス ガイドを参照してください。

  4. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: major

原因(Cause):電圧の問題(voltage-problem)

mibFaultCode:179

mibFaultName:fltProcessorUnitVoltageThresholdCritical

moClass:processor:Unit

タイプ(Type):機器(equipment)

fltProcessorUnitVoltageThresholdNonCritical

障害コード

F0178

説明

この障害が発生すると、次のいずれかのメッセージが表示されます。

  • メモリ チャネル([Id])の電圧が非重大しきい値の上限に達しました。(Memory channel ([Id]) voltage is upper non-critical.)

  • プロセッサ [Id] の電圧が非重大しきい値の上限に達しました。(Processor [Id] voltage is upper non-critical.)

  • プロセッサ [Id] の電圧しきい値が非重大しきい値の上限を超えました。電源を交換し、問題が解決したかどうかを確認してください。(Processor [Id] Voltage threshold has crossed upper non-critical threshold: Replace the Power Supply and verify if the issue is resolved.)それでも問題が解決されない場合は、Cisco TAC にお問い合わせください。(If the issue persists, call Cisco TAC.)

説明

この障害は、プロセッサの電圧が正常な動作範囲外にあるが、危険な段階にはまだ到達していない場合に発生します。通常、プロセッサは自然に回復します。

推奨処置

この障害が発生した場合は、次の処理を実行します。

  1. これ以上の低下がないかどうかプロセッサをモニタします。

  2. どのしきい値を超えたかを特定するために、CPU の SEL の統計情報を確認します。

  3. 電源装置を交換してください。

    このコンポーネントを交換する前に、前提条件、安全に関する推奨事項と警告について、サーバ固有のインストレーションおよびサービス ガイドを参照してください。

  4. 問題がまだ続く場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: minor

原因(Cause):電圧の問題(voltage-problem)

mibFaultCode:178

mibFaultName:fltProcessorUnitVoltageThresholdNonCritical

moClass:processor:Unit

タイプ(Type):機器(equipment)

fltProcessorUnitVoltageThresholdNonRecoverable

障害コード

F0180

説明

この障害が発生すると、次のいずれかのメッセージが表示されます。

  • メモリ チャネル([Id])の電圧が回復不能しきい値の上限に達しました。(Memory channel ([Id]) voltage is upper non-recoverable.)

  • プロセッサ [Id] の電圧が回復不能しきい値の上限に達しました。(Processor [Id] voltage is upper non-recoverable.)

  • プロセッサ [Id] の電圧しきい値が回復不能しきい値の上限を超えました。電源を交換し、問題が解決したかどうかを確認してください。(Processor [Id] Voltage threshold has crossed upper non-recoverable threshold: Replace the Power Supply and verify if the issue is resolved.)それでも問題が解決されない場合は、Cisco TAC にお問い合わせください。(If the issue persists, call Cisco TAC.)

説明

この障害は、プロセッサの電圧が指定したハードウェアの電圧定格を超えたことを示しています。高電圧は、プロセッサを傷つける可能性があります。

推奨処置

この障害が発生した場合は、tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: critical

原因(Cause):電圧の問題(voltage-problem)

mibFaultCode:180

mibFaultName:fltProcessorUnitVoltageThresholdNonRecoverable

moClass:processor:Unit

タイプ(Type):機器(equipment)