オンライン診断について
オンライン診断では、ハードウェアおよびデータ パスを確認し、障害のあるデバイスを特定します。
オンライン診断機能の概要
ゴールド (Generic Online Diagnostics) フレームワークでは、テストし、ライブ システムで、ハードウェア デバイスとデータ パスを確認します。
ゴールド テストは、次の 3 つのモードで実行できます。
-
ブートアップ
-
ヘルス モニタリング (ランタイムとも呼ばれる)
-
On-demand
次は、診断テスト スイート属性について説明します。
- B/C/* - Bypass bootup level test / Complete bootup level test / NA
- P/* - 1 回のポートのテスト/NA
- M/S/* - Only applicable to active / standby unit / NA
- D/N/* - Disruptive test / Non-disruptive test / NA
- H/O/* - モニタリングのテストは常に有効/条件付きでテストを有効/NA
- F/* - Fixed monitoring interval test / NA
- X/* - Not a health monitoring test / NA
- E/*-ライン カードのテストを Sup/NA
- L/* 排他的]: このテストの実行/NA
- T/*-オンデマンド テストではない/NA
- A/I/* - Monitoring is active / Monitoring is / NA
ブートアップ診断
Bootup diagnostics run during bootup and detect faulty hardware before a Cisco MDS 9700 Family switch brings a module online. たとえば、デバイスに障害のあるモジュールがある場合は、適切なブートアップ診断テストに失敗おり、障害を示しています。
(注) |
ブートアップの診断テストは、ブートアップ時にトリガーされます。 |
表 1 describes the bootup diagnostic tests for a linecard and a supervisor.
診断 |
Attributes |
説明 |
||
---|---|---|---|---|
ラインカード |
||||
EOBCPortLoopback |
C * * D X * * * * T * |
EOBC (イーサネット アウトオブ バンド接続) インターフェイスの状態を確認します。 |
||
OBFL |
C * * N X * * * * T * |
Verifies the integrity of the OBFL (Onboard Failure Logging) flash. |
||
BootupPortLoopback |
CP * N * * XE * T * |
PortLoopback test that runs only during module bootup.
|
||
スーパーバイザ |
||||
USB |
C * * N X * * * * T * |
Verifies the USB controller initialization on a module. |
||
ManagementPortLoopback |
C * * D X * * * * T * |
モジュールの管理インターフェイスの状態を確認します。 |
||
EOBCPortLoopback |
C * * D X * * * * T * |
EOBC (イーサネット アウトオブ バンド接続) インターフェイスの状態を確認します。 |
||
OBFL |
C * * N X * * * * T * |
Verifies the integrity of the OBFL (Onboard Failure Logging) flash. |
When the show module command is executed, the result of bootup diagnostics is displayed as Online Diag Status. The result of individual test is displayed when the show diagnostic result command is executed for appropriate module and test ID or test name.
Cisco MDS 9700 ファミリ スイッチは、ブートアップ診断をバイパスするか、ブートアップ診断の完全なセットを実行するように設定できます。起動診断レベルの設定を参照してください。
ヘルスモニタリング診断
ヘルス モニタリング(HM)診断は、定期的な間隔でライブ システムの状態を確認するためデフォルトで有効になっています。モニタリングの間隔(許可された範囲内)は、ユーザーにより設定可能で、各テストによって異なります。詳細については、診断テストのヘルス モニタリングのアクティブ化を参照してください。診断テストは、ハードウェアのエラーとデータ パスの問題を検出します。
ヘルス モニタリング診断は非破壊的です(データまたは制御トラフィックは中断されません)。ヘルス モニタリング テストは、ユーザーによって無効にすることができます。詳細については、診断テストのヘルス モニタリングを非アクティブ化を参照してください。
次の表では、スーパーバイザのヘルス モニタリング診断を説明しています。
診断 |
デフォルトのテスト間隔 |
Attributes |
説明 |
---|---|---|---|
スーパーバイザ |
|||
ASICRegisterCheck |
20 seconds |
***N******A |
スーパーバイザ上の ASIC のレジスタをスクラッチするための読み取りと書き込みアクセス権を確認します。 |
NVRAM |
5 分 |
***N******A |
スーパーバイザの NVRAM ブロックの健全性を確認します。 |
RealTimeClock |
5 分 |
***N******A |
スーパーバイザ上のリアルタイム クロックが時を刻んでいるかどうかを確認します。 |
PrimaryBootROM |
30 分 |
***N******A |
スーパーバイザ上のプライマリ ブート デバイスの完全性を確認します。 |
SecondaryBootROM |
30 分 |
***N******A |
スーパーバイザ上のセカンダリ ブート デバイスの完全性を確認します。 |
CompactFlash |
30 分 |
***N******A |
コンパクト フラッシュ デバイスにアクセスできるかどうかを確認します。 |
ExternalCompactFlash |
30 分 |
***N******A |
外部コンパクト フラッシュ デバイスにアクセスできるかどうかを確認します。 |
PwrMgmtBus |
30 秒 |
**MN******A |
スタンバイの電源管理制御バスを確認します。 |
SystemMgmtBus |
30 秒 |
**MN******A |
スタンバイ システム管理バスの使用可能性を確認します。 |
StatusBus |
30 秒 |
**MN******A |
スーパーバイザ、モジュール、およびファブリック カードに対するステータス バイパスによって送信されるステータスを確認します。 |
StandbyFabricLoopback |
30 秒 |
**SN******A |
ファブリック モジュールへのスタンバイ スーパバイザの接続を確認します。 |
表 1 describes the health monitoring diagnostics for the Cisco MDS 48-Port 16-Gbps Fibre Channel module.
診断 |
デフォルトのテスト間隔 |
Attributes |
説明 |
||
---|---|---|---|---|---|
ラインカード |
|||||
ASICRegisterCheck |
1 分 |
***N******A |
モジュール上の ASIC のレジスタをスクラッチするための読み取りと書き込みアクセス権を確認します。 |
||
PrimaryBootROM |
30 分 |
***N******A |
モジュール上のプライマリ ブート デバイスの完全性を確認します。 |
||
SecondaryBootROM |
30 分 |
***N******A |
モジュール上のセカンダリ ブート デバイスの完全性を確認します。 |
||
SnakeLoopback |
20 分 |
*P*N***E** |
Sup からラインカードのすべてのポートへの接続を確認します。プログレッシブな方法で、最大 MAC コンポーネントまでデータ パスの整合性を確認します。(テストを 1 つ実行するだけですべてのポートをカバーします)。これは、状態に関係なくすべてのポートで実行されます。 これは、中断のないテストです。 |
||
IntPortLoopback |
5 分 |
*P*N***E*** |
Sup からラインカードのすべてのポートへの接続を確認します(1 回に 1 ポート)。最大 MAC コンポーネントまでデータ パスの整合性を確認します。このテストは「オンデマンド モード」でトリガされると同様に、ヘルス モニタリング(HM)モードで実行されます。 このテストは、中断のないテストです。
|
||
RewriteEngine ループバック |
1 分 |
*P*N***E**A |
Sup からラインカードまでのファブリック モジュールの各リンクの整合性を確認します。 |
表 2 describes the health monitoring diagnostics for the Cisco MDS 48-Port 10-Gbps Fibre Channel over Ethernet Module.
診断 |
デフォルトのテスト間隔 |
Attributes |
説明 |
||
---|---|---|---|---|---|
ラインカード |
|||||
ASICRegisterCheck |
1 分 |
***N******A |
モジュール上の ASIC のレジスタをスクラッチするための読み取りと書き込みアクセス権を確認します。 |
||
PrimaryBootROM |
30 分 |
***N******A |
モジュール上のプライマリ ブート デバイスの完全性を確認します。 |
||
SecondaryBootROM |
30 分 |
***N******A |
モジュール上のセカンダリ ブート デバイスの完全性を確認します。 |
||
PortLoopback |
15 分 |
*P*D***E**A |
Sup からラインカードのすべてのポートへの接続を確認します。最大 PHY までのデータ パスの整合性を確認します。このテストは「オンデマンド モード」でトリガされると同様に、ヘルス モニタリング(HM)モードで実行されます。これはがダウンしているポートでのみ実行されます(管理上)。 これは、中断があるテストです。
|
||
RewriteEngine ループバック |
1 分 |
*P*N***E**A |
ラインカード間の各リンク、またはファブリック モジュールを経由する sup およびラインカードの整合性を確認します。 |
||
SnakeLoopback |
20 分 |
*P*N***E** |
Sup からラインカードのすべてのポートへの接続を確認します。プログレッシブ方法で、最大 MAC コンポーネントまでデータ パスの整合性を確認します。これは、状態に関係なくすべてのポートで実行されます。 これは、中断のないテストです。 |
オンデマンド診断
すべてのヘルス モニタリングのテストは、オンデマンドもカラーボタンことができます。オンデマンド診断は、ユーザが呼び出される場合にのみ実行されます。
Cisco MDS 48 ポート 16 Gbps ファイバ チャネル モジュール: オンデマンド モードでのみ呼び出すことができますを参照してくださいする 2 のテストはのみ 表 1 。
Cisco MDS 48 ポート 10 Gbps Fibre Channel over Ethernet モジュール: オンデマンド モードでのみ呼び出すことができるテストはありません。
(注) |
その他のヘルス モニタリングのテストでは検証されないするデータ パス (PHY と SFP) は、PortLoopback によって確認でき、ExtPortLoopback をテストします。 |
必要なときにオンデマンド診断を実行できます。詳細については、オンデマンド診断テストの開始または中止を参照してください。
Cisco MDS 48 ポート 16 Gbps ファイバ チャネルのモジュールで PortLoopback と ExtPortLoopback の両方のテストは、破壊的ためオンデマンド モードで使用可能な。
表 1 describes the on-demand diagnostics (for linecard only) on the Cisco MDS 48-Port 16-Gbps Fibre Channel module.
診断 |
Attributes |
説明 |
||||
---|---|---|---|---|---|---|
ラインカード |
||||||
PortLoopback |
* P D * * * XE。 |
Sup から、ラインカードのすべてのポートへの接続を確認します。PHY 最大データ パスの完全性を確認します。このテストは、「オンデマンドモード」でのみ使用できます。ポートの状態に関係なく、すべてのポートでのテストが実行されます。
|
||||
ExtPortLoopback |
* P D * * * XE。 |
SFP を含む PHY を最大には、[全体のデータ パスでのハードウェアのエラーを特定します。
|
注意 |
PortLoopback および ExtPortLoopback テストは、診断操作目的のポートを落としますに中断されます。 |
指定のヘルス モニタリング診断の回復アクション
ヘルス モニタリング診断テストが最大 10 回のしきい値超えて連続して失敗した場合、EEM を通してアラートの生成(callhome、syslog)やロギング(ログを除く OBFL)を含むデフォルト アクションが実行され、失敗したインスタンスで診断テストが無効になります(ポート、ファブリック、デバイス)。
これらのアクションは有益ですが、ネットワーク中断、トラフィック ブラック ホールなどの結果が生じるデバイス障害をライブ システムから除くものではありません。
(注) |
テストの結果をクリアし非アクティブにして、失敗したインスタンスでヘルス モニタリングを再起動してから、同じモジュールでテストをアクティブにします。詳細については、診断結果の消去、診断テストのヘルス モニタリングを非アクティブ化および診断テストのヘルス モニタリングのアクティブ化 を参照してください。 |
Cisco MDS NX-OS リリース 6.2(11) 以降では、次のヘルス モニタリングのテストのいずれかの連続失敗数がしきい値に到達した後、システムがデフォルト アクションに加えて修正 (回復) アクションを実行するように設定できます。
- PortLoopback テスト(Cisco MDS 48 ポート 10 Gbps の FCoE モジュールでのみサポートされます)
- RewriteEngineLoopback テスト
- StandbyFabricLoopback テスト
- 内部 PortLoopback テスト
(注) |
修正(回復)アクションはデフォルトでは無効です。 |
スーパーバイザへの修正(回復)アクション
スーパーバイザへの修正アクションは次のとおりです。
StandbyFabricLoopback test:システムがスタンバイ スーパバイザをリロードし、3 回試行した後、システムがスタンバイ スーパバイザの電源をオフにします。
(注) |
リロード後、スタンバイ スーパバイザがオンラインになったときに、デフォルトでヘルス モニタリング診断が起動します。 |
(注) |
1 回の再試行は、StandbyFabricLoopback テストの連続エラーしきい値に続いて、スタンバイ スーパバイザのリロードの完全なサイクルを意味します。 |
Cisco MDS 48 ポート 16 Gbps ファイバ チャネル モジュールの対処(回復)
各テストの修正アクションは次のとおりです。
- 内部 PortLoopback テスト:システムでは失敗したポートがダウンし、障害が発生している状態に変更されます。
- RewriteEngineLoopback テスト:システムは、障害のあるコンポーネント(スーパーバイザまたはファブリック)によって異なる修正措置を行います。
- スタンバイ スーパバイザを持つシャーシ(ha-standby 状態)では、システムがアクティブ スーパーバイザで障害を検出した場合、システムがスイッチ オーバーをトリガし、スタンバイ スーパバイザに経由で切り替えます。シャーシにスタンバイ スーパーバイザがない場合、システムはアクションを実行しません。
(注) |
PortLoopback テストが Cisco MDS 48 ポート 16 Gbps ファイバ チャネルのモジュールでオンデマンド モードでのみ使用可能なため、修正措置をサポートしていません。 |
(注) |
Cisco MDS NX-OS リリース 6.2(13) から RewriteEngineLookpback テストおよび RewriteEngineLoopback テストの修正措置は、Cisco MDS 48 ポート 16 Gbps ファイバ チャネルのモジュールでサポートされます。 |
Cisco MDS 48 ポート 10 Gbps の FCoE モジュールの対処 (回復)
- PortLoopback テスト]: システムが失敗したポートがダウンし、エラー ディセーブル状態にします。
- RewriteEngineLoopback テスト]: システムは、障害のあるコンポーネント (スーパーバイザまたはファブリック) によって異なる corrective action(是正措置、修正措置):
- (これは ha-standby 状態で) スタンバイ スーパバイザ、シャーシのアクティブ スーパーバイザで障害が検出されると、システム、「スイッチ オーバー」をトリガーとスタンバイ スーパバイザに経由でスイッチします。シャーシにスタンバイ スーパーバイザがない場合、システムはアクションを実行しません。
(注) |
シャーシ内のスタンバイ スーパバイザの電源がオフになって (StandbyFabricLoopback テストに関連付けられている) corrective action(是正措置、修正措置) への応答で、システムは、アクションをされません。 |
-
- 障害のあるコンポーネントがファブリック モジュールと判断した場合、RewriteEngineLoopback が連続して失敗すると 10 はテスト後に、、その特定のファブリック モジュールをリロードします。連続 3 回の 10 の連続したエラーおよびリロードのこのサイクルが発生し、ファブリック モジュールの電源がオフになってし。
- PortLoopback が連続して失敗すると 10 をテストする場合は、ポートとして、障害のあるコンポーネントが決定される、後に、システムは Faultyポートを error-disabled ステートに移動します。
ハイ アベイラビリティ
ハイ アベイラビリティの重要な機能は、ライブ システムでハードウェア障害を検出して、対処することです。GOLD はハードウェア障害を検出し、スイッチオーバーを決定するソフトウェアのコンポーネントへのフィードバックを提供することによって、システムのハイ アベイラビリティを提供します。
Cisco MDS 9700 ファミリ スイッチは、再起動後に実行中の設定を適用することによってGOLD ステートレス再起動をサポートします。スーパーバイザ スイッチオーバーの後に、GOLD は新しいアクティブ スーパーバイザから診断を再開します。