環境モニターリングについて
シャーシ コンポーネントの環境モニターリングは、コンポーネント障害の兆候を早期に警告します。この警告により、安全で信頼性の高いシステム運用を実現し、ネットワーク障害を防止できます。
ここでは、重要なシステム コンポーネントをモニターリングする方法について説明します。これにより、ハードウェア関連の問題点を特定し、速やかに対応できるようになります。
CLI コマンドによる環境のモニターリング
システムステータス情報を表示するには、show environment [all | counters | history | location | sensor | status | summary | table] コマンドを使用します。次の表に、キーワードの意味を示します。
キーワード |
目的 |
---|---|
all |
すべての環境モニター パラメータ(たとえば、電源、温度示度、電圧示度など)の詳細なリストを表示します。これはデフォルトです。 |
counters |
動作カウンタを表示します。 |
history |
センサーの状態変化履歴を表示します。 |
location |
ロケーション別にセンサーを表示します。 |
sensor |
センサーのサマリーを表示します。 |
status |
現場交換可能ユニット(FRU)の動作ステータスおよび電源と電源装置ファン センサーの情報を表示します。 |
summary |
すべての環境モニターリング センサーのサマリーを表示します。 |
table |
センサーの状態テーブルを表示します。 |
環境状態の表示
スーパーバイザ モジュールとそれらに関連付けられたラインカードは、カードごとに複数の温度センサーをサポートします。環境状態の出力には、各センサーから読み取った温度および各センサーの温度しきい値が表示されます。これらのラインカードは、警告、重大、シャットダウンの 3 つのしきい値をサポートしています。
次に、スーパーバイザ モジュールの環境状態を表示する例を示します。しきい値はカッコ内に表示されています。
Device# show environment
Number of Critical alarms: 0
Number of Major alarms: 0
Number of Minor alarms: 0
Slot Sensor Current State Reading Threshold(Minor,Major,Critical,Shutdown)
---------- -------------- --------------- ------------ ---------------------------------------
R0 Temp: InltFrnt Normal 27 Celsius (45 ,50 ,55 ,60 )(Celsius)
R0 Temp: InltRear Normal 28 Celsius (45 ,50 ,55 ,60 )(Celsius)
R0 Temp: OtltFrnt Normal 35 Celsius (75 ,80 ,85 ,90 )(Celsius)
R0 Temp: OtltRear Normal 43 Celsius (75 ,80 ,85 ,90 )(Celsius)
R0 Temp: UADP_0_0 Normal 54 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_1 Normal 53 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_2 Normal 53 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_3 Normal 55 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_4 Normal 54 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_5 Normal 55 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_6 Normal 64 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_7 Normal 59 Celsius (105,110,120,124)(Celsius)
R0 Temp: UADP_0_8 Normal 55 Celsius (105,110,120,124)(Celsius)
<output truncated>
次に、スーパーバイザ モジュールの LED ステータスを表示する例を示します。
Device# show hardware led
SWITCH: 1
SYSTEM: GREEN
Line Card : 1
PORT STATUS: (48) Fo1/0/1:BLACK Fo1/0/2:BLACK Fo1/0/3:BLACK Fo1/0/4:BLACK Fo1/0/5:BLACK Fo1/0/6:BLACK Fo1/0/7:BLACK Fo1/0/8:BLACK Fo1/0/9:BLACK Fo1/0/10:BLACK Fo1/0/11:BLACK Fo1/0/12:BLACK Fo1/0/13:BLACK Fo1/0/14:BLACK Fo1/0/15:BLACK Fo1/0/16:BLACK Fo1/0/17:BLACK Fo1/0/18:BLACK Fo1/0/19:BLACK Fo1/0/20:BLACK Fo1/0/21:GREEN Fo1/0/22:BLACK Fo1/0/23:BLACK Fo1/0/24:BLACK Hu1/0/25:GREEN Hu1/0/26:BLACK Hu1/0/27:BLACK Hu1/0/28:BLACK Hu1/0/29:BLACK Hu1/0/30:BLACK Hu1/0/31:BLACK Hu1/0/32:BLACK Hu1/0/33:BLACK Hu1/0/34:BLACK Hu1/0/35:BLACK Hu1/0/36:BLACK Hu1/0/37:BLACK Hu1/0/38:BLACK Hu1/0/39:BLACK Hu1/0/40:BLACK Hu1/0/41:BLACK Hu1/0/42:BLACK Hu1/0/43:BLACK Hu1/0/44:BLACK Hu1/0/45:BLACK Hu1/0/46:BLACK Hu1/0/47:BLACK Hu1/0/48:BLACK
BEACON: BLACK
STATUS: GREEN
Line Card : 2
PORT STATUS: (48) Fo2/0/1:BLACK Fo2/0/2:GREEN Fo2/0/3:GREEN Fo2/0/4:GREEN Fo2/0/5:GREEN Fo2/0/6:GREEN Fo2/0/7:GREEN Fo2/0/8:GREEN Fo2/0/9:GREEN Fo2/0/10:GREEN Fo2/0/11:GREEN Fo2/0/12:GREEN Fo2/0/13:GREEN Fo2/0/14:GREEN Fo2/0/15:GREEN Fo2/0/16:GREEN Fo2/0/17:GREEN Fo2/0/18:GREEN Fo2/0/19:GREEN Fo2/0/20:GREEN Fo2/0/21:GREEN Fo2/0/22:GREEN Fo2/0/23:GREEN Fo2/0/24:BLACK Hu2/0/25:BLACK Hu2/0/26:BLACK Hu2/0/27:BLACK Hu2/0/28:BLACK Hu2/0/29:BLACK Hu2/0/30:BLACK Hu2/0/31:BLACK Hu2/0/32:BLACK Hu2/0/33:BLACK Hu2/0/34:BLACK Hu2/0/35:BLACK Hu2/0/36:BLACK Hu2/0/37:BLACK Hu2/0/38:BLACK Hu2/0/39:BLACK Hu2/0/40:BLACK Hu2/0/41:BLACK Hu2/0/42:BLACK Hu2/0/43:BLACK Hu2/0/44:BLACK Hu2/0/45:BLACK Hu2/0/46:BLACK Hu2/0/47:BLACK Hu2/0/48:BLACK
BEACON: BLACK
STATUS: GREEN
MODULE: slot 3
SUPERVISOR: ACTIVE
PORT STATUS: (0)
BEACON: BLACK
STATUS: GREEN
SYSTEM: GREEN
ACTIVE: GREEN
MODULE: slot 4
SUPERVISOR: STANDBY
PORT STATUS: (0)
BEACON: BLACK
STATUS: GREEN
SYSTEM: GREEN
ACTIVE: AMBER
Line Card : 5
PORT STATUS: (48) Twe5/0/1:BLACK Twe5/0/2:GREEN Twe5/0/3:GREEN Twe5/0/4:GREEN Twe5/0/5:GREEN Twe5/0/6:GREEN Twe5/0/7:GREEN Twe5/0/8:GREEN Twe5/0/9:GREEN Twe5/0/10:GREEN Twe5/0/11:GREEN Twe5/0/12:GREEN Twe5/0/13:GREEN Twe5/0/14:GREEN Twe5/0/15:GREEN Twe5/0/16:GREEN Twe5/0/17:GREEN Twe5/0/18:GREEN Twe5/0/19:GREEN Twe5/0/20:GREEN Twe5/0/21:GREEN Twe5/0/22:GREEN Twe5/0/23:GREEN Twe5/0/24:GREEN Twe5/0/25:GREEN Twe5/0/26:GREEN Twe5/0/27:GREEN Twe5/0/28:GREEN Twe5/0/29:GREEN Twe5/0/30:GREEN Twe5/0/31:GREEN Twe5/0/32:GREEN Twe5/0/33:GREEN Twe5/0/34:GREEN Twe5/0/35:GREEN Twe5/0/36:GREEN Twe5/0/37:GREEN Twe5/0/38:GREEN Twe5/0/39:GREEN Twe5/0/40:GREEN Twe5/0/41:GREEN Twe5/0/42:GREEN Twe5/0/43:GREEN Twe5/0/44:GREEN Twe5/0/45:GREEN Twe5/0/46:GREEN Twe5/0/47:BLACK Twe5/0/48:BLACK
BEACON: BLACK
STATUS: GREEN
Line Card : 6
PORT STATUS: (48) Twe6/0/1:BLACK Twe6/0/2:GREEN Twe6/0/3:GREEN Twe6/0/4:GREEN Twe6/0/5:GREEN Twe6/0/6:GREEN Twe6/0/7:GREEN Twe6/0/8:GREEN Twe6/0/9:GREEN Twe6/0/10:GREEN Twe6/0/11:GREEN Twe6/0/12:GREEN Twe6/0/13:GREEN Twe6/0/14:GREEN Twe6/0/15:GREEN Twe6/0/16:GREEN Twe6/0/17:GREEN Twe6/0/18:GREEN Twe6/0/19:GREEN Twe6/0/20:GREEN Twe6/0/21:GREEN Twe6/0/22:GREEN Twe6/0/23:GREEN Twe6/0/24:GREEN Twe6/0/25:GREEN Twe6/0/26:GREEN Twe6/0/27:GREEN Twe6/0/28:GREEN Twe6/0/29:GREEN Twe6/0/30:GREEN Twe6/0/31:GREEN Twe6/0/32:GREEN Twe6/0/33:GREEN Twe6/0/34:GREEN Twe6/0/35:GREEN Twe6/0/36:BLACK Twe6/0/37:BLACK Twe6/0/38:BLACK Twe6/0/39:BLACK Twe6/0/40:GREEN Twe6/0/41:GREEN Twe6/0/42:GREEN Twe6/0/43:GREEN Twe6/0/44:GREEN Twe6/0/45:GREEN Twe6/0/46:BLACK Twe6/0/47:BLACK Twe6/0/48:BLACK
BEACON: BLACK
STATUS: GREEN
RJ45 CONSOLE: GREEN
GigabitEthernet0/0 (MGMT): GREEN
TenGigabitEthernet0/1 (SFP MGMT): BLACK
FANTRAY STATUS: GREEN
FANTRAY BEACON: BLACK
オンボード障害ロギング(OBFL)情報の表示
OBFL 機能は、スイッチに取り付けられているラインカードやスーパーバイザ モジュールの問題の診断に役立つ動作温度、ハードウェア稼働時間、割り込み、およびその他の重要なイベントとメッセージを記録します。データのログは、不揮発性メモリに保存されるファイルに作成されます。オンボード ハードウェアが起動すると、監視されている各領域で最初のレコードが作成され、後続のレコードの基準値となります。OBFL 機能は、継続的なレコードの収集と古い(履歴)レコードのアーカイブで循環更新スキームを提供し、システムに関する正確なデータを保証します。データは、測定と継続ファイルのサンプルのスナップショットを表示する継続情報の形式、または収集したデータに関する詳細を提供する要約情報の形式で記録されます。データを表示するには、show logging onboard コマンドを使用します。履歴データが利用できない場合は、「No historical data to display」というメッセージが表示されます。
Device# show logging onboard RP active voltage detail
--------------------------------------------------------------------------------
VOLTAGE SUMMARY INFORMATION
--------------------------------------------------------------------------------
Number of sensors : 33
--------------------------------------------------------------------------------
Sensor ID Normal Range Maximum Sensor Value
--------------------------------------------------------------------------------
CPU_P5V 0 0 - 5 5
CPU_P3V3 1 0 - 5 3
CPU_P2V5_VPP 2 0 - 5 2
CPU_PVCCSCFUSESUS 3 0 - 5 1
CPU_PVCCIN 4 0 - 5 1
CPU_P1V5_PCH 5 0 - 5 1
CPU_PVCCKRHV 6 0 - 5 1
CPU_P1V2_VDDQ 7 0 - 5 1
CPU_P1V05_COMBINED 8 0 - 5 1
CPU_P0V6_VTT 9 0 - 5 1
BB_P1V0_BCM82752 10 0 - 5 3
BB_P3V3_A 11 0 - 5 12
BB_P12V0 12 0 - 12 12
BB_P7V0 13 0 - 7 7
BB_P5V0 14 0 - 5 5
BB_P1V5 15 0 - 5 3
BB_P3V3 16 0 - 5 3
BB_P2V5 17 0 - 5 2
BB_P1V8 18 0 - 5 1
BB_P0V9_DP0_PLL 19 0 - 5 0
BB_P0V9_DP1_PLL 20 0 - 5 0
BB_P0V9_DP2_PLL 21 0 - 5 0
BB_P0V8_DP0_VDD 22 0 - 5 0
BB_P0V8_DP1_VDD 23 0 - 5 0
BB_P0V8_DP2_VDD 24 0 - 5 0
BB_P0V9_DP0_AVDD 25 0 - 5 0
BB_P0V9_DP1_AVDD 26 0 - 5 0
BB_P0V9_DP2_AVDD 27 0 - 5 1
BB_P1V1_HATH 28 0 - 5 1
BB_P1V1_DP0_AVDDH 29 0 - 5 1
BB_P1V2_HATH 30 0 - 5 3
BB_3V3_IRC 31 0 - 5 3
BB_P3V3_EUSB 32 0 - 5 0
--------------------------------------------------------------------------------
Sensor Value
Total Time of each Sensor
--------------------------------------------------------------------------------
value: 0
0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 94d, 577h, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 112d, 112d, 112d, 112d, 112d, 112d, 112d, 112d, 50d, 0s, 0s, 0s, 0s, 112d,
value: 1
0s, 0s, 0s, 112d, 112d, 112d, 112d, 112d, 50d, 426h, 645h, 0s, 0s, 0s, 61d, 50d, 0s, 61d, 50d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 112d, 112d, 50d, 0s, 0s,
value: 2
0s, 0s, 112d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 50d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s,
value: 3
0s, 112d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 50d, 0s, 0s, 0s, 61d, 50d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 61d, 112d, 0s,
value: 4
900h, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 160d, 43d, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s, 0s,
value: 5
<output truncated>
緊急処理
シャーシは、1 つのカードの電源を切って、ラインカードの過熱状態に対して詳細な応答を提供できます。ただし、シャーシは、スーパーバイザ モジュール自体の温度が重大しきい値を超過すると安全に動作させることができません。スーパーバイザ モジュールはシャーシの電源をオフにしてそのモジュール自体の過熱を防止します。このような場合、電源装置の電源オン/オフ スイッチまたは電源装置の AC または DC 入力電源をオフにしてから再びオンにして、スイッチを回復できます。
スーパーバイザのシャットダウン温度の緊急事態は、シャーシのシャットダウンをトリガーします。ラインカードのシャットダウン温度の緊急事態は、ラインカードをシャットダウンしますが、シャーシはシャットダウンしません。重大な温度の緊急事態は警告メッセージをトリガーし、ファンは最高速度になりますが、シャーシはシャットダウンしません。これはすべてのスロットに適用されます。
次の表に温度の緊急事態を示しますが、重大な緊急事態とシャットダウンの緊急事態を区別していません。
ケース 1. ファンの完全な障害による緊急状態 |
syslog メッセージが表示され、シャーシはシャットダウンします。 |
ケース 2. ラインカードの温度による緊急状態。 |
ラインカードの電源を切ります。 |
ケース 3. 電源の温度による緊急状態。シャットダウンアラームのしきい値を超えると、すべての電源装置がシャットダウンします。 |
デバイスの電源を再投入して、電源シャットダウンから回復します。 |
ケース 4. アクティブなスーパーバイザ モジュールの温度による緊急状態。 |
シャーシの電源を切断します。 |
システム アラーム
どのシステムにも、メジャーとマイナーの 2 種類のアラームがあります。メジャー アラームは、システムのシャットダウンにつながる可能性のある重大な問題を示します。マイナー アラームは情報で、対処しないと重大な問題となる可能性がある点について通知します。
次の表に、使用可能な環境アラームを示します。
警告しきい値を超える温度センサー |
マイナー |
||
重大しきい値を超える温度センサー |
メジャー |
||
シャットダウンしきい値を超える温度センサー |
メジャー |
||
ファンの部分的な障害 |
マイナー |
||
ファンの完全な障害
|
メジャー |
ファン障害アラームは、ファン障害状態が検知されると発生し、ファン障害状態が解消すると取り消されます。温度がしきい値温度に到達するとすぐに温度アラームが発行されます。スーパーバイザ モジュールの LED は、アラームが発生したかどうかを示します。
システムによってメジャー アラームが発生するとタイマーが始動しますが、その期間はアラームによって異なります。タイマーが切れるまでにアラームが取り消されない場合は、過熱による影響が生じないようにするためにシステムは緊急処理を行います。タイマー値および緊急処理は、スーパーバイザ モジュールのタイプによって異なります。
(注) |
スーパーバイザ モジュールのシステム LED の起動動作など、LED の詳細については、『Hardware Installation Guide』を参照してください。 |
イベント |
アラームの種類 |
スーパーバイザ LED の色 |
説明およびアクション |
---|---|---|---|
カードの温度が重大しきい値を超過 |
メジャー |
赤 |
アラームが発生すると、Syslog メッセージが表示されます。 |
カードの温度がシャットダウンしきい値を超過 |
メジャー |
赤 |
アラームが発生すると、Syslog メッセージが表示されます。 |
シャーシの温度が警告しきい値を超過 |
マイナー |
オレンジ |
アラームが発生すると、Syslog メッセージが表示されます。 |
シャーシ ファン トレイの部分的な障害 |
マイナー |
オレンジ |
アラームが発生すると、Syslog メッセージが表示されます。 |
シャーシ ファン トレイの完全な障害 |
メジャー |
赤 |
アラームが発生すると、Syslog メッセージが表示されます。 |
サーマルシャットダウンの無効化
Cisco IOS XE Gibraltar 16.11.1 リリース以降、システムのサーマルシャットダウンを手動で無効にするオプションが導入されました。これにより、温度が重大およびシャットダウン温度を超えた場合でも、シャーシの電源をオフにするスーパバイザエンジンの動作がトリガーされなくなります。サーマルシャットダウンのディセーブル機能を使用すると、システムがすでにシャットダウン状態になっている場合でも、システムのサーマル シャットダウン プロセスをバイパスできます。
サーマルシャットダウンのディセーブルオプションを設定するには、thermal shutdown disable コマンドを使用します。更新された設定をスタートアップ コンフィギュレーションに保存すると、システムは、次の電源再投入またはシステムのリロード後に、サーマルシャットダウンを無効にして起動します。
システムのサーマルシャットダウン機能を再度有効にするには、no thermal shutdown disable コマンドを使用します。
サーマルシャットダウンのディセーブル機能は、高可用性を完全にはサポートしていません。次に、サポートされないケースを示します。
-
アクティブなスーパバイザエンジンでのみサーマルシャットダウンがディセーブルになっている場合、システムがシャットダウン状態になったときに 2 番目のスーパバイザエンジンを起動すると、システムはシャットダウンしたままになります。
-
両方のスーパバイザエンジンでサーマルシャットダウンがディセーブルになっていて、システムがシャットダウン状態になった場合、サーマルシャットダウン機能を再度有効にすると、システムはシャットダウンしません。変更を有効にするには、設定の変更をスタートアップ コンフィギュレーションに保存し、スイッチをリロードする必要があります。
次の表に、スーパバイザエンジンの状態と、これらの各状態のサーマル シャットダウン ディセーブル設定サポートの可能な組み合わせを示します。
アクティブ スーパバイザ |
スタンバイ スーパバイザ |
サーマルシャットダウンのディセーブル設定のサポート |
---|---|---|
シャットダウン状態 |
シャットダウン状態 |
|
正常状態 |
シャットダウン状態 |
|
シャットダウン状態 |
正常状態 |
|
正常状態 |
正常状態 |
|