ハイ アベイラビリティの設定

この章では、高可用性の構成方法と、スイッチオーバー プロセスについて説明します。

機能情報の確認

ご使用のソフトウェア リリースで、このモジュールで説明されるすべての機能がサポートされているとは限りません。最新の警告および機能情報については、https://tools.cisco.com/bugsearch/ の Bug Search Tool およびご使用のソフトウェア リリースのリリース ノートを参照してください。このモジュールに記載されている機能の詳細を検索し、各機能がサポートされているリリースのリストを確認する場合は、「新機能および変更された機能に関する情報」の章、またはこの章の「機能の履歴」表を参照してください。

ハイ アベイラビリティの機能履歴

この表には、新機能と変更された機能がリストされています。

表 1. 新機能および変更された機能

機能名

リリース

機能情報

スタンバイ スーパーバイザの mgmt0 ステータス

9.2(1)

シスログは、スタンバイ スーパーバイザのイーサネット管理ポートが切断にされるまたは、ISSUまたは、システム スイッチオーバー実行する前場合、ユーザーをアラートするために紹介されました。

show interface mgmt number standby コマンドは、アクティブ スーパーバイザから発行されたスーパーバイザの mgmt0 リンクのステータスを表示するために紹介されました。

system switchover bypass-standby-mgmt0 コマンドは、スタンバイ スーパーバイザの mgmt0 リンクのステータスのチェックをスイッチオーバー中にスキップするために紹介されました。

内部 CRC 検出と分離

8.5(1)

分離なしの内部 CRC 検出とエラー ロギングは、デフォルトで有効になっています。

スタンバイ スーパーバイザの mgmt0 リンク

8.4(2)

Cisco MDS ディレクタ スイッチ上のスタンバイ スーパーバイザの管理イーサネット リンクは、スーパーバイザがスタンバイ状態になるとアップ状態になります。

内部 CRC 検出と分離

8.4(2)

アクションを実行せずに内部 CRC エラーをログに記録するオプションが追加されました。

次のコマンドが変更されました。

hardware fabric crc [threshold count] [log-only]

ハイ アベイラビリティの設定

この章では、高可用性の構成方法と、スイッチオーバー プロセスについて説明します。

高可用性について

プロセスの再起動性は、Cisco MDS 9000 シリーズ スイッチに高可用性機能を提供します。このプロセスにより、プロセスレベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。また、失敗したプロセスを自動的に再起動します。このプロセスは、障害が発生する前の状態を復元でき、障害が発生した時点から実行を継続します。

Cisco MDS NX-OS リリース 8.4(2)から Cisco MDS ディレクタ スイッチ上のスタンバイ スーパーバイザのマネジメント イーサネット リンクは、スーバーバイザがスタンバイ ステートに到達した場合に起動します。これにより、隣接するイーサネット スイッチのポートが継続的にダウンし、デコミッションされる可能性があるとして検出されるのを防ぐことができます。

Cisco MDS NX-OS リリース 9.2(1)以降、In-Service Software Upgrade(ISSU)、ソフトウェア ダウングレード(ISSD)、またはシステム スイッチオーバーを実行する前に、スタンバイ スーパーバイザのイーサネット管理リンクが切断またはダウンした場合、NX-OS は syslog をチェックして出力し、ユーザに警告します。 show interface mgmt number standby コマンドを使用して、現用系スーパーバイザから発行されたときにスタンバイ スーパーバイザの mgmt0 リンクのステータスを表示することもできます。 system switchover bypass-standby-mgmt0 コマンドを使用すると、システムのスイッチ オーバー時にスタンバイ スーパーバイザの mgmt0 リンクのステータスのチェックをスキップできます。システム メッセージの詳細については、Cisco MDS 9000 ファミリおよび Nexus 7000 シリーズ NX-OS システム メッセージ リファレンスを参照してください。

HA スイッチオーバーには次の特性があります。

  • 制御トラフィックは影響を受けないため、ステートフル(中断なし)です。

  • スイッチング モジュールは影響を受けないため、データ トラフィックは中断されません。

  • スイッチング モジュールはリセットされません。


Note


auto-copy が進行中の場合、スイッチオーバーは許可されません。

スイッチオーバー プロセス

スイッチオーバーは、次の 2 つのプロセスのいずれかによって発生します:

  • 現用系スーパーバイザ モジュールに障害が発生すると、スタンバイ スーパーバイザ モジュールが自動的に引き継ぎます。
  • 現用系スーパーバイザ モジュールからスタンバイ スーパーバイザ モジュールへのスイッチオーバーは手動で開始します。

スイッチオーバー プロセスが開始されると、安定したスタンバイ スーパーバイザ モジュールが使用可能になるまで、同じスイッチで別のスイッチオーバー プロセスを開始することはできません。


Caution


スタンバイ スーパーバイザ モジュールが安定した状態(HA スタンバイ)でない場合、スイッチオーバーは実行されません。


スーパーバイザ モジュールの同期

実行イメージは、アクティブ スーパーバイザ モジュールによってスタンバイ スーパーバイザ モジュールで自動的に同期されます。ブート変数は、このプロセス中に同期されます。

スタンバイ スーパーバイザ モジュールは、現用系スーパーバイザ モジュール上の画像を実行画像と一緒に自動的に同期します。


Note


スーパーバイザ モジュールの起動元のイメージは、ブート フラッシュから削除できません。これは、新しいスタンバイ スーパーバイザ モジュールがプロセス中に同期できるようにするためです。

手動スイッチオーバーのガイドライン

手動スイッチオーバーを実行する場合は、次のガイドラインに注意してください。

  • スイッチオーバーを手動で開始すると、システム メッセージに 2 つのスーパーバイザ モジュールの存在が示されます。
  • スイッチオーバーは、スイッチで 2 つのスーパーバイザ モジュールが機能している場合にのみ実行できます。
  • シャーシ内のモジュールが機能しています。

スイッチオーバーの手動による起動

現用系スーパーバイザ モジュールからスタンバイ スーパーバイザ モジュールへのスイッチオーバーを手動で開始するには、system switchover コマンドを使用します。このコマンドを入力した後、安定したスタンバイ スーパーバイザ モジュールが使用可能になるまで、同じスイッチで別のスイッチオーバー プロセスを開始することはできません。

HA スイッチオーバーが可能であることを確認するには、 show system redundancy status コマンドまたは show module コマンドを入力します。コマンドの出力にスタンバイ スーパーバイザ モジュールの HA スタンバイ状態が表示された場合は、スイッチオーバーが可能です。詳細については、 「スイッチオーバーの可能性の確認」 を参照してください。

スイッチオーバーの可能性の確認

ここでは、手動スイッチオーバーの前にスイッチとモジュールのステータスを確認する方法について説明します。

  • show interface mgmt number standby コマンドを使用して、スタンバイ スーパーバイザの mgmt0 リンクがアップしていることを確認します。

  • show system redundancy status コマンドを使用して、システムがスイッチオーバーを受け入れる準備ができていることを確認します。

  • モジュールのステータス(とプレゼンス)のいつでもを確認をするために show module コマンドを使用します。show module コマンドの出力例を次に示します:

    switch# show module
    Mod Ports Module-Type Model Status
    --- ----- ------------------------------- ------------------ ------------
    2 8 IP Storage Services Module DS-X9308-SMIP ok
    5 0 Supervisor/Fabric-1 DS-X9530-SF1-K9 active *
    6 0 Supervisor/Fabric-1 DS-X9530-SF1-K9 ha-standby
    8 0 Caching Services Module DS-X9560-SMAP ok
    9 32 1/2 Gbps FC Module DS-X9032 ok
    Mod MAC-Address(es) Serial-Num
    --- -------------------------------------- ----------
    2 00-05-30-00-9d-d2 to 00-05-30-00-9d-de JAB064605a2
    5 00-05-30-00-64-be to 00-05-30-00-64-c2 JAB06350B1R
    6 00-d0-97-38-b3-f9 to 00-d0-97-38-b3-fd JAB06350B1R
    8 00-05-30-01-37-7a to 00-05-30-01-37-fe JAB072705ja
    9 00-05-30-00-2d-e2 to 00-05-30-00-2d-e6 JAB06280ae9
    * this terminal session

    出力の Status カラムは、スイッチング モジュールで ok ステータス、スーパーバイザ モジュールで active か HA-standby になっている必要があります。ステータスが OK か active である場合は、構成を続けることができます。

  • show boot auto-copy コマンドを使用して、自動コピー機能の構成を確認し、スタンバイ スーパーバイザ モジュールへの自動コピーが進行中かどうかを確認します。 show boot auto-copy コマンドの出力例は次のとおりです:

    switch# show boot auto-copy
    Auto-copy feature is enabled
    switch# show boot auto-copy list
    No file currently being auto-copied

内部 CRC 検出と分離の構成


Note


この機能は、デフォルトで無効になっています。


内部 CRC 検出と分離を構成するには、次の手順を実行します:

Procedure

Step 1

次の構成モードを入力します。

switch# configure terminal

Step 2

内部 CRC 検出、分離、およびエラー ロギングを有効にします:

switch(config)# hardware fabric crc [threshold count]

または

Cisco MDS NX-OS リリース 8.4(2)以降のリリースで、分離せずに内部 CRC 検出とエラー ロギングを有効にします:

switch(config)# hardware fabric crc [threshold count] log-only

Cisco MDS NX-OS リリース 8.5(1)以降では、分離なしの内部 CRC 検出およびエラー ロギングがデフォルトで有効になっています。

エラー率は 24 時間の連続ウィンドウで測定され、エラーカウントは各ウィンドウの開始時に 0 にリセットされます。しきい値の範囲は 1 ~ 100 です。しきい値が指定されていない場合、デフォルトのしきい値は 3 です。

Step 3

(任意)内部 CRC 検出、分離、およびエラー ロギングを無効化にします。

switch(config)# no hardware fabric crc

Step 4

この構成変更を保存します:

switch(config)# copy running-config startup-config


内部 CRC 検出と分離のデフォルト設定

次の表に、インターフェイス パラメータのデフォルト設定値を示します。

Table 2. 内部 CRC 検出と分離のデフォルト設定

パラメータ

デフォルト

内部 CRC エラー処理

ディセーブル

スタンバイ スーバーバイザ モジュールに起動変数画像をコピー

アクティブ スーパーバイザ モジュールにある(スタンバイ スーパーバイザ モジュールにはない)ブート変数イメージをスタンバイ スーパーバイザ モジュールにコピーできます。スタンバイ スーパーバイザ モジュールに設定されている KICKSTART および SYSTEM ブート変数のみをコピーできます。モジュール(ラインカード)イメージには、すべてのブート変数が対応するスタンバイの場所(bootflash: または slot0:)にまだ存在しない場合、コピーされます。

ブート変数の自動コピーの有効化

ブート変数の自動コピーを有効または無効にするには、次の手順を実行します:

Procedure

Step 1

コンフィギュレーション モードに入ります。

switch# configure terminal

switch(configure)#

Step 2

アクティブ スーパーバイザ モジュールからスタンバイ スーパーバイザ モジュールへのブート変数の自動コピーを有効化にします(デフォルト)。

switch(configure)# boot auto-copy

自動コピーが管理上有効

Step 3

自動コピー機能を無効化にします。

switch(configure)# boot auto-copy

自動コピーが管理上無効化


コピーされたブート変数 の確認

show boot auto-copy コマンドを使用して、コピーされたブート変数の現在の状態を確認します。この出力例は、自動コピーが有効になっていることを示しています:


switch# show boot auto-copy
Auto-copy feature enabled

次の出力例は、自動コピーが無効になっていることを示しています:


switch# show boot auto-copy
Auto-copy feature disabled

show boot auto-copy list コマンドを使用して、コピーされているファイルを確認します。この出力例は、スタンバイ スーパーバイザ モジュールのブートフラッシュにコピーされているイメージを示しています。これが成功すると、次のファイルは image2.bin になります。


Note


このコマンドは、アクティブなスーパーバイザ モジュール上のファイルだけを表示します。

switch# show boot auto-copy list
File: /bootflash:/image1.bin
Bootvar: kickstart
File:/bootflash:/image2.bin
Bootvar: system

次に、 auto-copy オプションが無効になっている場合、またはファイルがコピーされていない場合の一般的なメッセージの出力例を示します:


switch# show boot auto-copy list
No file currently being auto-copied

HA ステータス情報の表示

システムの HA ステータスを表示するには、 show system redundancy status コマンドを使用します。冗長状態から内部状態 Table 1 および Table 3 の表では、冗長状態、スーパーバイザ状態、および内部状態の出力値について説明します。


switch# show system redundancy status
Redundancy mode
---------------
      administrative:   HA
         operational:   HA
This supervisor (sup-1)
-----------------------
    Redundancy state:   Active
    Supervisor state:   Active
      Internal state:   Active with HA standby
Other supervisor (sup-2)
------------------------
    Redundancy state:   Standby
    Supervisor state:   HA standby
      Internal state:   HA standby

次の条件は、自動同期が可能な場合を示します:

  • 1 つのスーパーバイザ モジュールの内部状態が HA スタンバイで現用系であり、もう一方のスーパーバイザ モジュールが ha-standby である場合、スイッチは動作上 HA であり、自動同期ができます。

  • いずれかのスーパーバイザ モジュールの内部状態が none の場合、スイッチは自動同期は、できません。

次の表に、冗長状態の使用可能な値を示します。

Table 3. 冗長状態

状態

説明

なし

スーパーバイザ モジュールが存在しないか、シャーシに接続されていません。

初期化中

この診断が合格し、構成がダウンロードされています。

アクティブ

アクティブなスーパーバイザ モジュールとスイッチを構成できます。

スタンバイ

スイッチオーバーが可能です。

失敗

スイッチは初期化中にスーパーバイザ モジュールの障害を検出しました。スイッチはモジュールの電源の再投入を 3 回自動的に試します。3 回目の試行後は、引き続き失敗状態が表示されます。

Note

 
スーパーバイザ モジュールが HA スタンバイとして起動するまで、スーパーバイザ モジュールの初期化を試みる必要があります。この状態は一時的な状態です。

オフライン

スーパーバイザ モジュールは、デバッグのために意図的にシャットダウンされます。

BIOS で

スイッチはスーパーバイザ モジュールとの接続を確立し、ブートアップ診断を実行しています。

不明(Unknown)

システムは無効な状態です。問題が解決しない場合は、TAC にお問い合わせください。

次の表に、スーパーバイザ モジュール状態の使用可能な値を示します。

Table 4. スーパーバイザの状態

状態

説明

アクティブ

スイッチ内の現用系スーパーバイザ モジュールは、構成できます。

HA スタンバイ

スイッチオーバーが可能です。

オフライン

スイッチは、デバッグのために意図的にシャットダウンされます。

不明(Unknown)

スイッチが無効な状態であり、TAC へのサポートコールが必要です。

次の表に、内部冗長状態の使用可能な値を示します。

Table 5. 内部状態

状態

説明

HA スタンバイ

スタンバイ状態のスーパーバイザ モジュール内の HA スイッチオーバー メカニズムで有効です(スーパーバイザ モジュールの同期 セクションを参照します)。

スタンバイなしで有効です

スイッチオーバーが不可能です。

HA スタンバイで有効です

スイッチ内の現用系スーパーバイザ モジュールは、構成できます。スタンバイ スーパーバイザ モジュールが HA スタンバイ状態です。

シャットダウン

スイッチをシャットダウンしています。

HA スイッチオーバーが進行中です

スイッチは HA スイッチオーバー メカニズムに切り替え中です。

オフライン

スイッチは、デバッグのために意図的にシャットダウンされます。

HA 同期が進行中です。

スタンバイ スーパーバイザ モジュールは、その状態をアクティブ スーパーバイザ モジュールと同期中です。

スタンバイ(失敗)

スタンバイ スーパーバイザ モジュールが機能していない。

スタンバイなしで無効です

アクティブ スーパーバイザ モジュールと 2 番目のスーパーバイザ モジュールが存在するが機能していません。

Other

このスイッチは、一時的なステートにあります。問題が解決しない場合は、TAC にお問い合わせください。

Cisco MDS NX-OS リリース 8.5(1)以降では、 show hardware fabric crc status コマンドを使用して、内部 CRC 検出および分離機能のステータスを表示します。


switch# show hardware fabric crc status
Hardware Fabric CRC Action : log-only
Hardware Fabric CRC Feature threshold per module stage : 3
Hardware Fabric CRC Feature sampling time in hours : 24

システム稼働時間の表示

システムの稼働時間とは、シャーシの電源が投入され、スイッチを制御するスーパーバイザ モジュールが少なくとも 1 つ搭載されている時間を指します。 reset コマンドを使用して、システムの稼働時間を再初期化します。デュアル スーパーバイザを使用するスイッチでは、無停止のアップグレードおよびスイッチオーバーによってシステムの稼働時間が再初期化されません。つまり、システムの稼働時間は、このようなアップグレードとスイッチオーバー間で連続します。

カーネルの稼働時間は、NX-OS ソフトウェアがスーパーバイザ モジュールにロードされてからの時間を指します。 reset および reload コマンドを使用して、カーネルの稼働時間を再初期化します。

アクティブ スーパーバイザの稼働時間は、NX-OS ソフトウェアがアクティブ スーパーバイザ モジュールにロードされてからの時間を指します。アクティブ スーパーバイザの稼働時間は、無停止スイッチオーバー後のカーネルの稼働時間よりも短くなる可能性があります。

show system uptime コマンドを使用すると、システムの開始時刻、カーネルの稼働時間、およびアクティブなスーパーバイザを表示できます。

次に、スーパーバイザの稼働時間を表示する例を示します:


switch# show system uptime
System start time:          Fri Aug 27 09:00:02 2004 
System uptime:              1546 days, 2 hours, 59 minutes, 9 seconds 
Kernel uptime:              117 days, 1 hours, 22 minutes, 40 seconds 
Active supervisor uptime:   117 days, 0 hours, 30 minutes, 32 seconds 

高可用性の詳細については、第 1 章 「高可用性の概要」を参照してください。