Cisco UCS C シリーズ サーバ Integrated Management Controller 障害 リファレンス ガイド
CIMC の障害
CIMC の障害
発行日;2013/06/13 | 英語版ドキュメント(2013/05/21 版) | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 777KB) | フィードバック

目次

CIMC の障害

シャーシ関連の障害

fltEquipmentChassisThermalThresholdCritical

fltEquipmentChassisThermalThresholdNonCritical

fltEquipmentChassisThermalThresholdNonRecoverable

ファン関連の障害

fltEquipmentFanDegraded

fltEquipmentFanInoperable

fltEquipmentFanModuleMissing

fltEquipmentFanPerfThresholdNonCritical

fltEquipmentFanPerfThresholdCritical

fltEquipmentFanPerfThresholdNonRecoverable

fltEquipmentFanMissing

I/O モジュール関連の障害

fltEquipmentIOCardRemoved

fltEquipmentIOCardThermalProblem

fltEquipmentIOCardThermalThresholdNonCritical

fltEquipmentIOCardThermalThresholdCritical

fltEquipmentIOCardThermalThresholdNonRecoverable

メモリ関連の障害

fltMemoryUnitDegraded

fltMemoryUnitInoperable

fltMemoryUnitThermalThresholdNonCritical

fltMemoryUnitThermalThresholdCritical

fltMemoryUnitThermalThresholdNonRecoverable

fltMemoryArrayVoltageThresholdCritical

fltMemoryArrayVoltageThresholdNonRecoverable

fltMemoryUnitIdentityUnestablishable

プロセッサ関連の障害

fltProcessorUnitInoperable

fltProcessorUnitThermalNonCritical

fltProcessorUnitThermalThresholdCritical

fltProcessorUnitThermalThresholdNonRecoverable

fltProcessorUnitDisabled

電源関連の障害

fltEquipmentPsuInoperable

fltEquipmentPsuThermalThresholdNonCritical

fltEquipmentPsuThermalThresholdCritical

fltEquipmentPsuMissing

fltEquipmentPsuThermalThresholdNonRecoverable

fltEquipmentPsuVoltageThresholdCritical

fltEquipmentPsuVoltageThresholdNonRecoverable

fltEquipmentPsuPerfThresholdNonCritical

fltEquipmentPsuPerfThresholdCritical

fltEquipmentPsuPerfThresholdNonRecoverable

fltEquipmentPsuIdentity

fltEquipmentPsuPowerThreshold

fltEquipmentPsuInputError

サーバ関連の障害

fltStorageLocalDiskInoperable

fltComputeBoardPowerError

fltComputePhysicalBiosPostTimeout

fltComputeBoardCmosVoltageThresholdCritical

fltComputeBoardCmosVoltageThresholdNonRecoverable

fltStorageRaidBatteryInoperable

fltComputeIOHubThermalNonCritical

fltComputeIOHubThermalThresholdCritical

fltComputeIOHubThermalThresholdNonRecoverable

fltComputePhysicalPostFailure

fltComputeBoardPowerFail

fltComputeBoardThermalProblem

CIMC の障害

この章では、CIMC WebUI で発生する/レポートされる可能性のある障害の情報を提供します。

この章は、次の項で構成されています。

「シャーシ関連の障害」

「ファン関連の障害」

「I/O モジュール関連の障害」

「メモリ関連の障害」

「プロセッサ関連の障害」

「電源関連の障害」

「サーバ関連の障害」

シャーシ関連の障害

fltEquipmentChassisThermalThresholdCritical

障害コード:F0409

メッセージ:

Thermal condition on chassis [id] cause: [thermalStateQualifier]

説明

この障害は、次の条件で発生します。

シャーシ内のコンポーネントが安全な熱動作範囲外で動作している場合。

推奨処置

この障害が発生した場合は、次の処理を実行します。


ステップ 1 IOM の温度をチェックし、推奨される安全な動作温度範囲内にあることを確認します。

ステップ 2 1 つまたは両方の IOM に対して「Thermal Sensor threshold crossing in IOM」エラーの障害がレポートされた場合、その IOM に熱の障害が発生していないか確認します。これらの障害には、熱状態の詳細が含まれます。

ステップ 3 「Missing or Faulty Fan」エラーの障害がレポートされた場合、そのファンのステータスをチェックします。交換が必要な場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

ステップ 4 上記のアクションで問題を解決できず、状態が続く場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 409
mibFaultName: fltEquipmentChassisThermalThresholdCritical
moClass: equipment:Chassis
Type: environmental

fltEquipmentChassisThermalThresholdNonCritical

障害コード:F0410

メッセージ:

Thermal condition on chassis [id] cause: [thermalStateQualifier]

説明:

この障害は、次の条件で発生します。

シャーシ内のコンポーネントが安全な熱動作範囲外で動作している場合。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 IOM の温度が、推奨される安全な動作温度範囲内にあることを確認します。

ステップ 2 1 つまたは両方の IOM に対して「Thermal Sensor threshold crossing in IOM」エラーの障害がレポートされた場合、その IOM に熱の障害が発生していないか確認します。これらの障害には、熱状態の詳細が含まれます。

ステップ 3 「Missing or Faulty Fan」エラーの障害がレポートされた場合、そのファンのステータスをチェックします。交換が必要な場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

ステップ 4 上記のアクションで問題を解決できず、状態が続く場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 410
mibFaultName: fltEquipmentChassisThermalThresholdNonCritical
moClass: equipment:Chassis
Type: environmental

fltEquipmentChassisThermalThresholdNonRecoverable

障害コード:F0411

メッセージ:

Thermal condition on chassis [id] cause: [thermalStateQualifier]

説明:

この障害は、次の条件で発生します。

シャーシ内のコンポーネントが安全な熱動作範囲外で動作している場合。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 IOM の温度が、推奨される安全な動作温度範囲内にあることを確認します。

ステップ 2 1 つまたは両方の IOM に対して「Thermal Sensor threshold crossing in IOM」エラーの障害がレポートされた場合、その IOM に熱の障害が発生していないか確認します。これらの障害には、熱状態の詳細が含まれます。

ステップ 3 「Missing or Faulty Fan」エラーの障害がレポートされた場合、そのファンのステータスをチェックします。交換が必要な場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

ステップ 4 上記のアクションで問題を解決できず、状態が続く場合は、シャーシに対する show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 411
mibFaultName: fltEquipmentChassisThermalThresholdNonRecoverable
moClass: equipment:Chassis
Type: environmental

ファン関連の障害

fltEquipmentFanDegraded

障害コード:F0371

メッセージ:

Fan [id] in Fan Module: [operability]Fan [id] in Fan Module [tray]-[id] under server [id] operability: [operability]

説明:

この障害は、ファン モジュールの 1 つまたは複数のファンが動作していないが、少なくとも 1 つのファンは動作している場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、ファン モジュールの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、ファン モジュールに適切なエアーフローを確保します。

ステップ 3 エアーフローが妨げられていないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 故障したファン モジュールを交換します。

ステップ 7 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: equipment-degraded
CallHome: none
mibFaultCode: 371
mibFaultName: fltEquipmentFanDegraded
moClass: equipment:Fan
Type: equipment

fltEquipmentFanInoperable

障害コード:F0373

メッセージ:

Fan [id] in Fan Module: [operability]Fan [id] in Fan Module [tray]-[id] under server [id] operability: [operability]

説明:

この障害は、ファンが動作しない場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 ファン モジュールを取り外して、もう一度取り付け直します。一度に取り外せるファン モジュールは 1 つだけです。

ステップ 2 ファン モジュールを別のファン モジュールと交換します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: environmental
mibFaultCode: 373
mibFaultName: fltEquipmentFanInoperable
moClass: equipment:Fan
Type: equipment

fltEquipmentFanModuleMissing

障害コード:F0377

メッセージ:

[presence]Fan module [tray]-[id] in server [id] presence:

説明:

この障害は、ファン モジュールがスロットに取り付けられていないか、スロットから取り外されている場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 スロットが空であることが報告されている場合は、スロットにファン モジュールを挿入します。

ステップ 2 スロットにファン モジュールが装着されていることが報告されている場合は、ファン モジュールをいったん取り外し、もう一度挿入します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: warning
Cause: equipment-missing
CallHome: none
mibFaultCode: 377
mibFaultName: fltEquipmentFanModuleMissing
moClass: equipment:FanModule
Type: equipment

fltEquipmentFanPerfThresholdNonCritical

障害コード:F0395

メッセージ:

[perf]Fan [id] in Fan Module [tray]-[id] under server [id] speed: [perf]

説明:

この障害は、ファン コントローラから読み取ったファン速度が必要なファン速度と一致せず、正常な動作の範囲外である場合に発生します。これはファンまたはファン コントローラからの読み取りに問題がある可能性を示しています。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 ファン ステータスをモニタします。

ステップ 2 問題が長期間にわたって継続するか、他のファンで同じ問題が起きない場合は、ファンを装着し直します。

ステップ 3 ファン モジュールを交換します。

ステップ 4 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: info
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 395
mibFaultName: fltEquipmentFanPerfThresholdNonCritical
moClass: equipment

fltEquipmentFanPerfThresholdCritical

障害コード:F0396

メッセージ:

[perf]Fan [id] in Fan Module [tray]-[id] under server [id] speed: [perf]

説明:

この障害は、ファン コントローラから読み取ったファン速度が必要なファン速度と一致せず、重大しきい値を超え、障害の危険がある場合に発生します。これはファンまたはファン コントローラからの読み取りに問題がある可能性を示しています。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 ファン ステータスをモニタします。

ステップ 2 問題が長期間にわたって継続するか、他のファンで同じ問題が起きない場合は、ファンを装着し直します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、シャーシの show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: info
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 396
mibFaultName: fltEquipmentFanPerfThresholdCritical
moClass: equipment:

fltEquipmentFanPerfThresholdNonRecoverable

障害コード:F0397

メッセージ:

[perf]Fan [id] in Fan Module [tray]-[id] under server [id] speed: [perf]

説明:

この障害は、ファン コントローラから読み取られたファン速度が、必要なファン速度をかなり超えている場合に発生します。これは、多くの場合、ファンに障害が発生していることを示しています。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 ファンを交換します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: info
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 397
mibFaultName: fltEquipmentFanPerfThresholdNonRecoverable
moClass: equipment:Fan
Type: equipment

fltEquipmentFanMissing

障害コード:F0434

メッセージ:

[presence]Fan [id] in Fan Module [tray]-[id] under server [id] presence: [presence]

説明:

この障害は、ファン モジュールのファンを検出できないという、まれなイベントで発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 問題を報告しているスロットにファン モジュールを挿入/再挿入します。

ステップ 2 可能な場合は、ファン モジュールを別のファン モジュールと交換します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: warning
Cause: equipment-missing
CallHome: none
mibFaultCode: 434
mibFaultName: fltEquipmentFanMissing
moClass: equipment:Fan
Type: equipment

I/O モジュール関連の障害

fltEquipmentIOCardRemoved

障害コード:F0376

メッセージ:

[side] IOM [chassisId]/[id] is removed.

説明:

通常、この障害は、I/O モジュールがシャーシから取り外されているために発生します。スタンドアロン構成の場合、その I/O モジュールに関連付けられているシャーシのネットワーク接続は失われます。これによりネットワーク接続が失われ、I/O モジュールからのデータ トラフィックが中断されるため、重大な障害となります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 I/O モジュールを再挿入します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: equipment-removed
CallHome: none
mibFaultCode: 376
mibFaultName: fltEquipmentIOCardRemoved
moClass: equipment:IOCard
Type: equipment

fltEquipmentIOCardThermalProblem

障害コード:F0379

メッセージ:

[side] IOM [chassisId]/[id] operState: [operState]

説明:

この障害は、I/O モジュールに熱問題がある場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、I/O モジュールの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、I/O モジュールに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシのエアーフローが妨げられていないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 障害のある I/O モジュールを交換します。

ステップ 7 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 379
mibFaultName: fltEquipmentIOCardThermalProblem
moClass: equipment:IOCard
Type: environmental

fltEquipmentIOCardThermalThresholdNonCritical

障害コード:F0729

メッセージ:

[side] IOM [chassisId]/[id] ([switchId]) temperature: [thermal]

説明:

この障害は、I/O モジュールの温度が非重大しきい値を超えたが、まだ重大しきい値未満である場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、I/O モジュールの動作温度範囲を確認します。

ステップ 2 Cisco UCS シャーシおよび I/O モジュールのエアーフローが妨げられないことを確認します。

ステップ 3 サイトの冷却システムが正常に動作していることを確認します。

ステップ 4 未使用のラック サーバの電源をオフにします。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 729
mibFaultName: fltEquipmentIOCardThermalThresholdNonCritical
moClass: equipment:IOCard
Type: environmental

fltEquipmentIOCardThermalThresholdCritical

障害コード:F0730

メッセージ:

[side] IOM [chassisId]/[id] ([switchId]) temperature: [thermal]

説明:

この障害は、I/O モジュールの温度が重大しきい値を超えた場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、I/O モジュールの動作温度範囲を確認します。

ステップ 2 サイトの冷却システムが正常に動作していることを確認します。

ステップ 3 未使用のラック サーバの電源をオフにします。

ステップ 4 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 5 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 730
mibFaultName: fltEquipmentIOCardThermalThresholdCritical
moClass: equipment:IOCard
Type: environmental

fltEquipmentIOCardThermalThresholdNonRecoverable

障害コード:F0731

メッセージ:

[side] IOM [chassisId]/[id] temperature: [thermal]

説明:

この障害は、I/O モジュールの温度が動作範囲外になっている場合に発生します。

この問題は回復不能です。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、I/O モジュールの動作温度範囲を確認します。

ステップ 2 Cisco UCS シャーシおよび I/O モジュールのエアーフローが妨げられないことを確認します。

ステップ 3 サイトの冷却システムが正常に動作していることを確認します。

ステップ 4 未使用のラック サーバの電源をオフにします。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 731
mibFaultName: fltEquipmentIOCardThermalThresholdNonRecoverable
moClass: equipment:IOCard
Type: environmental

メモリ関連の障害

fltMemoryUnitDegraded

障害コード:F0184

メッセージ:

DIMM [location] on server [chassisId]/[slotId] operability: [operability]DIMM [location] on server [id]

operability: [operability]

説明:

この障害は、DIMM が縮退運転状態である場合に発生します。通常、この状態は、DIMM での過剰な数の修正可能な ECC エラーが、サーバ BIOS によって報告されている場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 DIMM の ECC エラーをさらにモニタします。相当数のエラーが解決しなかった場合は、DIMM が動作不能になっている可能性が高いです。

ステップ 2 DIMM が動作不能になっている場合は、DIMM を交換します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: equipment-degraded
CallHome: none
mibFaultCode: 184
mibFaultName: fltMemoryUnitDegraded
moClass: memory:Unit
Type: equipment

fltMemoryUnitInoperable

障害コード:F0185

メッセージ:

DIMM [location] on server [chassisId]/[slotId] operability: [operability]DIMM [location] on server [id]

operability: [operability]

説明:

通常、この障害は、しきい値を超える数の修正可能または修正不可能なエラーが DIMM で発生したために発生します。DIMM は動作不能になっている場合があります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 SEL がイネーブルの場合は、DIMM の SEL 統計情報を確認して、しきい値を超えたかを判断します。

ステップ 2 必要な場合は、DIMM を交換します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: diagnostic
mibFaultCode: 185
mibFaultName: fltMemoryUnitInoperable
moClass: memory:Unit

fltMemoryUnitThermalThresholdNonCritical

障害コード:F0186

メッセージ:

DIMM [location] on server [chassisId]/[slotId] temperature: [thermal]DIMM [location] on server [id]

temperature: [thermal]

説明:

この障害は、ラック サーバのメモリ装置の温度が非重大しきい値を超えたが、まだ重大しきい値未満である場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 186
mibFaultName: fltMemoryUnitThermalThresholdNonCritical
moClass: memory:Unit
Type: environmental

fltMemoryUnitThermalThresholdCritical

障害コード:F0187

メッセージ:

DIMM [location] on server [chassisId]/[slotId] temperature: [thermal]DIMM [location] on server [id]

temperature: [thermal]

説明:

この障害は、ラック サーバのメモリ装置の温度が重大しきい値を超えている場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 187
mibFaultName: fltMemoryUnitThermalThresholdCritical
moClass: memory:Unit
Type: environmental

fltMemoryUnitThermalThresholdNonRecoverable

障害コード:F0188

メッセージ:

DIMM [location] on server [chassisId]/[slotId] temperature: [thermal]DIMM [location] on server [id] temperature: [thermal]

説明:

この障害は、ラック サーバのメモリ装置の温度が動作範囲外になっている場合に発生します。この問題は回復不能です。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 188
mibFaultName: fltMemoryUnitThermalThresholdNonRecoverable
moClass: memory:Unit
Type: environmental

fltMemoryArrayVoltageThresholdCritical

障害コード:F0190

メッセージ:

Memory array [id] on server [chassisId]/[slotId] voltage: [voltage]Memory array [id] on server [id] voltage: [voltage]

説明:

この障害は、メモリ アレイの電圧が指定したハードウェアの電圧定格を超えた場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 SEL がイネーブルの場合は、DIMM の SEL 統計情報を確認して、しきい値を超えたかを判断します。

ステップ 2 メモリ アレイをモニタして、さらに低下するかを確認します。

ステップ 3 電源装置を交換してください。

ステップ 4 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: voltage-problem
CallHome: environmental
mibFaultCode: 190
mibFaultName: fltMemoryArrayVoltageThresholdCritical
moClass: memory:Array

fltMemoryArrayVoltageThresholdNonRecoverable

障害コード:F0191

メッセージ:

Memory array [id] on server [chassisId]/[slotId] voltage: [voltage]Memory array [id] on server [id] voltage: [voltage]

説明:

この障害は、メモリ アレイの電圧が指定したハードウェアの電圧定格を超過し、メモリのハードウェアが損傷するか危険な状態になる可能性がある場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 SEL がイネーブルの場合は、DIMM の SEL 統計情報を確認して、しきい値を超えたかを判断します。

ステップ 2 メモリ アレイをモニタして、さらに低下するかを確認します。

ステップ 3 電源装置を交換してください。

ステップ 4 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: voltage-problem
CallHome: environmental
mibFaultCode: 191
mibFaultName: fltMemoryArrayVoltageThresholdNonRecoverable
moClass: memory:Array
Type: environmental

fltMemoryUnitIdentityUnestablishable

障害コード:F0502

メッセージ:

DIMM [location] on server [chassisId]/[slotId] has an invalid FRUDIMM [location] on server [id] has an invalid FRU

説明:

通常、この障害は、センサーによってサーバ内にサポートされていない DIMM が検出された場合に発生します。たとえば、モデル、ベンダー、またはリビジョンは認識されません。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サーバの設定で DIMM がサポートされているかどうかを確認します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、サーバにサポートされていない DIMM または DIMM 設定がある可能性があります。Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: warning
Cause: identity-unestablishable
CallHome: none
mibFaultCode: 502
mibFaultName: fltMemoryUnitIdentityUnestablishable
moClass: memory:Unit
Type: equipment

プロセッサ関連の障害

fltProcessorUnitInoperable

障害コード:F0174

メッセージ:

Processor [id] on server [chassisId]/[slotId] operability: [operability]

説明:

この障害は、プロセッサに壊滅的なエラーが発生した場合、または事前設定された熱/電力しきい値を超えた場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 障害の原因が温度の問題であると考えられる場合は、サーバへのエアーフローが妨げられずに十分に換気されているかどうかを確認します。可能であれば、ヒート シンクがプロセッサに正しく固定されているかどうかを確認します。

ステップ 2 障害の原因が装置の動作不良であると考えられる場合は、Cisco TAC に問い合わせて指示を受けてください。

ステップ 3 障害の原因が電源または電圧の問題であると考えられる場合は、その問題が代替電源で解決するかどうかを確認することを推奨します。問題が解決しない場合は、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: diagnostic
mibFaultCode: 174
mibFaultName: fltProcessorUnitInoperable
moClass: processor:Unit
Type: equipment

fltProcessorUnitThermalNonCritical

障害コード:F0175

メッセージ:

Processor [id] on server [chassisId]/[slotId] temperature: [thermal]Processor [id] on server [id] temperature: [thermal]

説明:

この障害は、ラック サーバのプロセッサの温度が非重大しきい値を超えたが、まだ重大しきい値未満である場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 175
mibFaultName: fltProcessorUnitThermalNonCritical
moClass: processor:Unit
Type: environmental

fltProcessorUnitThermalThresholdCritical

障害コード:F0176

メッセージ:

Processor [id] on server [chassisId]/[slotId] temperature: [thermal]Processor [id] on server [id] temperature: [thermal]

説明:

この障害は、ラック サーバのプロセッサの温度が重大しきい値を超えている場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 176
mibFaultName: fltProcessorUnitThermalThresholdCritical
moClass: processor:Unit
Type: environmental

fltProcessorUnitThermalThresholdNonRecoverable

障害コード:F0177

メッセージ:

Processor [id] on server [chassisId]/[slotId] temperature: [thermal]Processor [id] on server [id] temperature: [thermal]

説明:

この障害は、ラック サーバのプロセッサの温度が動作範囲外になっている場合に発生します。この問題は回復不能です。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

CPU のセンサーが 82 °C(179.6 °F)に到達すると、システムはその CPU をオフラインにします。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、サーバの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、サーバに適切なエアーフローを確保します。

ステップ 3 Cisco UCS シャーシまたはラック内のサーバのエアーフローが妨げられないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 177
mibFaultName: fltProcessorUnitThermalThresholdNonRecoverable
moClass: processor:Unit
Type: environmental

fltProcessorUnitDisabled

障害コード:F0842

メッセージ:

Processor [id] on server [chassisId]/[slotId] operState: [operState]Processor [id] on server [id] operState: [operState]

説明:

この障害は、プロセッサがディセーブルになっているという、まれなイベントで発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 この障害が発生した場合は、サーバをシャーシから取り外してから、シャーシに再挿入します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: info
Cause: equipment-disabled
CallHome: none
mibFaultCode: 842
mibFaultName: fltProcessorUnitDisabled
moClass: processor:Unit
Type: environmental

電源関連の障害

fltEquipmentPsuInoperable

障害コード:F0374

メッセージ:

[operability]Power supply [id] in server [id] operability: [operability]

説明:

通常、この障害は、電源装置がオフラインであるか、入力/出力電圧が範囲外である場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 電源コードが PSU および電源に正しく接続されていることを確認します。

ステップ 2 電源が 220 V であることを確認します。

ステップ 3 PSU を取り外して再度設置します。

ステップ 4 PSU を交換します。

ステップ 5 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: environmental
mibFaultCode: 374
mibFaultName: fltEquipmentPsuInoperable
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuThermalThresholdNonCritical

障害コード:F0381

メッセージ:

[thermal]Power supply [id] in server [id] temperature: [thermal]

説明:

この障害は、PSU モジュールの温度が非重大しきい値を超えたが、まだ重大しきい値未満である場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、PSU モジュールの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、PSU モジュールに適切なエアーフローを確保します。

ステップ 3 エアーフローが妨げられていないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 障害のある PSU モジュールを交換します。

ステップ 7 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 381
mibFaultName: fltEquipmentPsuThermalThresholdNonCritical
moClass: equipment:Psu
Type: environmental

fltEquipmentPsuThermalThresholdCritical

障害コード:F0383

メッセージ:

[thermal]Power supply [id] in server [id] temperature: [thermal]

説明:

この障害は、PSU モジュールの温度が重大しきい値を超えた場合に発生します。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、PSU モジュールの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、PSU モジュールに適切なエアーフローを確保します。

ステップ 3 エアーフローが妨げられていないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 障害のある PSU モジュールを交換します。

ステップ 7 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 383
mibFaultName: fltEquipmentPsuThermalThresholdCritical
moClass: equipment:Psu
Type: environmental

fltEquipmentPsuMissing

障害コード:F0378

メッセージ:

[presence]Power supply [id] in server [id] presence: [presence]

説明:

通常、この障害は、電源モジュールがないか、またはサーバへの入力電力がない場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 電源装置が電源に接続されているかどうかを確認します。

ステップ 2 PSU がスロットに物理的に存在する場合は、いったん取り外し、取り付け直します。

ステップ 3 PSU がスロットに物理的に存在していない場合は、新しい PSU を取り付けます。

ステップ 4 この障害が発生した場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: warning
Cause: equipment-missing
CallHome: none
mibFaultCode: 378
mibFaultName: fltEquipmentPsuMissing
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuThermalThresholdNonRecoverable

障害コード:F0385

メッセージ:

[thermal]Power supply [id] in server [id] temperature: [thermal]

説明:

この障害は、PSU モジュールの温度が動作範囲外になっている場合に発生します。この問題は回復不能です。次の原因となる可能性のある要因に注意してください。

極端な温度下では、Cisco UCS 機器の動作の効率が低下が生じたり、早期劣化、チップの障害、および機器の障害を含むさまざまな問題が生じたりすることがあります。また、極端な温度変化によって、CPU がソケットから外れることがあります。

Cisco UCS 機器は、吸気温度が 10 °C(50 °F)を下回らず、35 °C(95 °F)を上回らない環境で動作する必要があります。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 製品仕様書で、PSU モジュールの動作温度範囲を確認します。

ステップ 2 『Cisco UCS Site Preparation Guide』を確認して、前面および背面のスペースを含め、PSU モジュールに適切なエアーフローを確保します。

ステップ 3 エアーフローが妨げられていないことを確認します。

ステップ 4 サイトの冷却システムが正常に動作していることを確認します。

ステップ 5 設置場所のクリーニングを定期的に実施して、ほこりやごみがたまらないようにしてください。ほこりやごみがたまるとシステムが過熱するおそれがあります。

ステップ 6 障害のある PSU モジュールを交換します。

ステップ 7 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 385
mibFaultName: fltEquipmentPsuThermalThresholdNonRecoverable
moClass: equipment:Psu
Type: environmental

fltEquipmentPsuVoltageThresholdCritical

障害コード:F0389

メッセージ:

[voltage]Power supply [id] in server [id] voltage: [voltage]

説明:

この障害は、PSU の電圧が指定したハードウェアの電圧定格を超えた場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 PSU を取り外し、再度取り付けてください。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: voltage-problem
CallHome: environmental
mibFaultCode: 389
mibFaultName: fltEquipmentPsuVoltageThresholdCritical
moClass: equipment:Psu
Type: environmental

fltEquipmentPsuVoltageThresholdNonRecoverable

障害コード:F0391

メッセージ:

[voltage]Power supply [id] in server [id] voltage: [voltage]

説明:

この障害は、PSU の電圧が指定したハードウェアの電圧定格を超え、結果として PSU ハードウェアが損傷しているか、または損傷するおそれがある場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 PSU を取り外し、再度取り付けてください。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: voltage-problem
CallHome: environmental
mibFaultCode: 391
mibFaultName: fltEquipmentPsuVoltageThresholdNonRecoverable
moClass: equipment:Psu
Type: environmental

fltEquipmentPsuPerfThresholdNonCritical

障害コード:F0392

メッセージ:

[perf]Power supply [id] in server [id] output power: [perf]

説明:

この障害は、ラック サーバの PSU の現在の出力が目的の出力値と一致していない場合に、警告として発生します。

推奨されるアクション:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 PSU のステータスをモニタします。

ステップ 2 可能であれば、PSU を取り外して、再度取り付けます。

ステップ 3 上記のアクションで問題を解決できなかった場合は、シャーシの show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 392
mibFaultName: fltEquipmentPsuPerfThresholdNonCritical
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuPerfThresholdCritical

障害コード:F0393

メッセージ:

[perf]Power supply [id] in server [id] output power: [perf]

説明:

この障害は、ラック サーバの PSU の現在の出力が目的の出力値と一致していない場合に、警告として発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 PSU のステータスをモニタします。

ステップ 2 可能であれば、PSU を取り外して、再度取り付けます。

ステップ 3 上記のアクションで問題を解決できなかった場合は、シャーシの show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 393
mibFaultName: fltEquipmentPsuPerfThresholdCritical
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuPerfThresholdNonRecoverable

障害コード:F0394

メッセージ:

[perf]Power supply [id] in server [id] output power: [perf]

説明:

この障害は、ラック サーバの PSU の現在の出力が目的の出力値と一致していない場合に、警告として発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 PSU のステータスをモニタします。

ステップ 2 可能であれば、PSU を取り外して、再度取り付けます。

ステップ 3 上記のアクションで問題を解決できなかった場合は、シャーシの show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: performance-problem
CallHome: diagnostic
mibFaultCode: 394
mibFaultName: fltEquipmentPsuPerfThresholdNonRecoverable
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuIdentity

障害コード:F0407

メッセージ:

Power supply [id] on chassis [id] has a malformed FRUPower supply [id] on server [id] has a malformed FRU

説明:

通常、この障害は、電源装置ユニットの FRU 情報が破損した場合、または不正な形式の場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 電源装置のベンダー仕様を確認します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: fru-problem
CallHome: diagnostic
mibFaultCode: 407
mibFaultName: fltEquipmentPsuIdentity
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuPowerThreshold

障害コード:F0882

メッセージ:

Power supply [id] on chassis [id] has exceeded its power thresholdPower supply [id] on server [id] has exceeded its power threshold.

説明:

この障害は、電源装置ユニットが電流を過剰に引き込んでいる場合に発生します。

推奨されるアクション:

この障害が発生した場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: power-problem
CallHome: none
mibFaultCode: 882
mibFaultName: fltEquipmentPsuPowerThreshold
moClass: equipment:Psu
Type: equipment

fltEquipmentPsuInputError

障害コード:F0883

メッセージ:

Power supply [id] on chassis [id] has disconnected cable or bad input voltagePower supply [id] on server [id] has disconnected cable or bad input voltage.

説明:

この障害は、電源コードが切断されているか、または入力電圧が誤っている場合に発生します。

推奨処置:

この障害が発生した場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: power-problem
CallHome: none
mibFaultCode: 883
mibFaultName: fltEquipmentPsuInputError
moClass: equipment:Psu
Type: equipment

サーバ関連の障害

fltStorageLocalDiskInoperable

障害コード:F0181

メッセージ:

Local disk [id] on server [chassisId]/[slotId] operability: [operability]Local disk [id] on server [id] operability: [operability]

説明:

このエラーは、サーバの使用中にローカル ディスクが動作不能になった場合、または取り外された場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サポートされているスロットにディスクを挿入します。

ステップ 2 ローカル ディスクをいったん取り外し、もう一度差し込みます。

ステップ 3 別のディスクがある場合は、ディスクを交換します。

ステップ 4 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: none
mibFaultCode: 181
mibFaultName: fltStorageLocalDiskInoperable
moClass: storage:LocalDisk

fltComputeBoardPowerError

障害コード:F0310

メッセージ:

Motherboard of server [chassisId]/[slotId] (service profile: [assignedToDn]) power: [operPower]Motherboard of server [id] (service profile: [assignedToDn]) power: [operPower]

説明:

通常、この障害は、サーバの電源センサーが問題を検出した場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 電源装置を取り付け直すか、交換します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: power-problem
CallHome: none
mibFaultCode: 310
mibFaultName: fltComputeBoardPowerError
moClass: compute:Board
Type: environmental

fltComputePhysicalBiosPostTimeout

障害コード:F0313

メッセージ:

Server [id] (service profile: [assignedToDn]) BIOS failed power-on self testServer [chassisId]/[slotId] (service profile: [assignedToDn]) BIOS failed power-on self test.

説明:

通常、この障害は、サーバに診断エラーが発生したときに発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 CIMC WebUI に接続し、POST 障害が発生した KVM から記録します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: equipment-inoperable
CallHome: diagnostic
mibFaultCode: 313
mibFaultName: fltComputePhysicalBiosPostTimeout
moClass: compute:Physical
Type: equipment

fltComputeBoardCmosVoltageThresholdCritical

障害コード:F0424

メッセージ:

Possible loss of CMOS settings: CMOS battery voltage on server [chassisId]/[slotId] is [cmosVoltage]Possible loss of CMOS settings: CMOS battery voltage on server [id] is [cmosVoltage]

説明:

この障害は、CMOS のバッテリ電圧が正常な動作範囲よりも低くなっている場合に発生します。これはクロックやその他の CMOS 設定に影響を与えることがあります。

推奨処置:

この障害が発生した場合は、バッテリを交換してください。


 

障害の詳細

Severity: minor
Cause: voltage-problem
CallHome: none
mibFaultCode: 424
mibFaultName: fltComputeBoardCmosVoltageThresholdCritical
moClass: compute:Board
Type: environmental

fltComputeBoardCmosVoltageThresholdNonRecoverable

障害コード:F0425

メッセージ:

Possible loss of CMOS settings: CMOS battery voltage on server [chassisId]/[slotId] is [cmosVoltage]Possible loss of CMOS settings: CMOS battery voltage on server [id] is [cmosVoltage]

説明:

この障害は、CMOS のバッテリ電圧が非常に低くなり、回復不能の可能性がある場合に発生します。これはクロックやその他の CMOS 設定に影響を与えます。

推奨処置:

この障害が発生した場合は、バッテリを交換してください。


 

障害の詳細

Severity: major
Cause: voltage-problem
CallHome: none
mibFaultCode: 425
mibFaultName: fltComputeBoardCmosVoltageThresholdNonRecoverable
moClass: compute:Board
Type: environmental

fltStorageRaidBatteryInoperable

障害コード:F0531

メッセージ:

RAID Battery on server [chassisId]/[slotId] operability: [operability]RAID Battery on server [id] operability: [operability]

説明:

この障害は、RAID のバッテリ電圧が正常な動作範囲を下回っている場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 RAID バッテリを交換します。

ステップ 2 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-inoperable
CallHome: diagnostic
mibFaultCode: 531
mibFaultName: fltStorageRaidBatteryInoperable
moClass: storage:RaidBattery
Type: equipment

fltComputeIOHubThermalNonCritical

障害コード:F0538

メッセージ:

IO Hub on server [chassisId]/[slotId] temperature: [thermal]

説明:

この障害は、IO コントローラの温度が非重大しきい値より上または下に外れている場合に発生します。

推奨処置:

この障害が発生した場合は、このサーバに関連するその他の環境イベントをモニタし、温度範囲が推奨される範囲内にあることを確認します。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 538
mibFaultName: fltComputeIOHubThermalNonCritical
moClass: compute:IOHub
Type: environmental

fltComputeIOHubThermalThresholdCritical

障害コード:F0539

メッセージ:

IO Hub on server [chassisId]/[slotId] temperature: [thermal]

説明:

この障害は、IO コントローラの温度が重大しきい値より上または下に外れている場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サーバに関連するその他の環境イベントをモニタし、温度範囲が推奨される範囲内にあることを確認します。

ステップ 2 可能であれば、しばらくの間、サーバの電源をオフにしておくことを検討してください。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: major
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 539
mibFaultName: fltComputeIOHubThermalThresholdCritical
moClass: compute:IOHub
Type: environmental

fltComputeIOHubThermalThresholdNonRecoverable

障害コード:F0540

メッセージ:

IO Hub on server [chassisId]/[slotId] temperature: [thermal]

説明:

この障害は、IO コントローラの温度が動作回復の可能な範囲から外れている場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サーバをただちにシャットダウンします。

ステップ 2 show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 540
mibFaultName: fltComputeIOHubThermalThresholdNonRecoverable
moClass: compute:IOHub
Type: environmental

fltComputePhysicalPostFailure

障害コード:F0517

メッセージ:

Server [id] POST or diagnostic failureServer [chassisId]/[slotId] POST or diagnostic failure.

説明:

通常、この障害は、POST 中にサーバで診断障害またはエラーが発生した場合に発生します。

推奨処置:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サーバの POST の結果をチェックします。

ステップ 2 サーバをリブートします。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support コマンドを実行し、シスコのテクニカル サポートにお問い合わせください。


 

障害の詳細

Severity: major
Cause: equipment-problem
CallHome: none
mibFaultCode: 517
mibFaultName: fltComputePhysicalPostFailure
moClass: compute:Physical
Type: server

fltComputeBoardPowerFail

障害コード:F0868

メッセージ:

[power]Motherboard of server [id] power: [power]

説明:

通常、この障害は、サーバの電源センサーが問題を検出した場合に発生します。

推奨処置:

この障害が発生した場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: critical
Cause: power-problem
CallHome: diagnostic
mibFaultCode: 868
mibFaultName: fltComputeBoardPowerFail
moClass: compute:Board
Type: environmental

fltComputeBoardThermalProblem

障害コード:F0869

メッセージ:

Motherboard of server [chassisId]/[slotId] : [assignedToDn]) thermal: [thermal]Motherboard of server [id] : [assignedToDn]) thermal: [thermal]

説明:

通常、この障害は、サーバのマザーボード温度センサーが問題を検出した場合に発生します。

推奨されるアクション:

この障害が発生した場合は、次の処理を実行します。


ステップ 1 サーバのファンが正しく動作していることを確認します。

ステップ 2 24 時間待機して、問題が解決しているかどうかを確認します。

ステップ 3 上記のアクションで問題を解決できなかった場合は、show tech-support ファイルを作成し、Cisco TAC にお問い合わせください。


 

障害の詳細

Severity: minor
Cause: thermal-problem
CallHome: environmental
mibFaultCode: 869
mibFaultName: fltComputeBoardThermalProblem
moClass: compute:Board
Type: environmental