クラスタの管理とリカバリのシナリオ

この付録には、Cisco IOA クラスタ内の 1 台以上のスイッチがオフラインの場合、またはあるスイッチから別のスイッチにマスター スイッチの割り当てを変更する場合に使用するクラスタ管理およびリカバリ手順に関する情報が含まれています。


Note


  • この付録の手順では、CLI を使用するトラブルシューティング ソリューションについて説明します。

  • オフラインスイッチの Cisco IOA クラスタ設定は、CLI を使用して行う必要があります。オンライン スイッチの Cisco IOA クラスタ設定は、Cisco DCNM-SAN または CLI を使用して実行できます。


この付録は、次の項で構成されています。

クラスタ クォーラムとマスタースイッチの選択

このセクションでは、Cisco IOA クラスタ クォーラムと、クラスタ内のマスター スイッチを選択するプロセスについて説明します。

ノード ID

クラスタ内のすべてのスイッチにはノード ID があります。Cisco IOA は、クラスタに追加されるすべての新しいスイッチにノード ID を割り当てます。クラスタが作成されるスイッチには、ノード ID 1 が割り当てられます。これがマスター スイッチです。新しいスイッチがクラスタに追加されると、次に使用可能な最も高いノード ID が割り当てられます。たとえば、2 番目のスイッチがクラスタに追加されると、そのスイッチのノード ID は 2、3 番目のスイッチのノード ID は 3、というようになります。

クラスタビュー

クラスタ ビューは、運用クラスタの一部であるスイッチのセットです。

クラスタ クォーラム

クラスタを動作させるには、クラスタ ビューに構成されているスイッチ数の半分以上が含まれている必要があります。N ノードクラスタでは、N/2 + 1 のノードがクラスタクォーラムを形成します。

N が偶数の場合、クラスタ クォーラムには N/2 ノードが必要であり、最小のノード ID を持つスイッチの存在も必要です。

クォーラム ロジックは、クラスタ パーティションが発生した場合でも、少なくとも 1 つのパーティションが動作可能であることを保証します。他のすべてのスイッチは動作しません。これにより、クラスタの一貫性が保証されます。

マスター スイッチの選択

クラスタが作成されると、クラスタが作成されたスイッチがクラスタ マスター スイッチになります。マスター スイッチに障害が発生するか、またはリブートされると、別のスイッチがマスター スイッチの役割を引き継ぎます。マスター選択ロジックは、ノード ID と最新のクラスタ構成を使用して、クラスタ内のどのスイッチがマスター スイッチになるかを決定します。マスター選定ロジックは次のとおりです:

  • 動作中のクラスタでマスター スイッチに障害が発生した場合、次に小さいノード ID を持つスイッチがマスター スイッチとして処理を引き継ぎます。動作中のクラスタでは、すべてのスイッチが同じクラスタ構成を実行することに注意してください。
    • 前のマスター スイッチがオンラインに戻ってクラスタに参加しても、すぐにはマスターになりません。
  • クラスタのすべてのスイッチが起動すると、最新のクラスタ構成を持つスイッチがマスター スイッチになります。同じ構成のスイッチが複数ある場合は、ノード ID が最も小さいスイッチがマスター スイッチとして選択されます。
    • マスター スイッチが選択され、クラスタが動作可能(クォーラムがある)になると、ノード ID が小さいスイッチが後でクラスタに参加しても、マスター スイッチは変更されません。

たとえば、ノード ID がそれぞれ 1、2、および 3 の 3 つのスイッチ S1、S2、および S3 があるとします。スイッチ S2 と S3 がクォーラムを形成すると、スイッチ S2 がマスター スイッチになります。ノード ID が 1 のスイッチ S1 が起動し、後でクラスタに参加した場合でも、スイッチ S2 が引き続きマスターになります。ただし、スイッチ S2 が何らかの理由でダウンした場合は、スイッチ S1 がマスター スイッチになります。

2 スイッチ クラスタのシナリオ

クラスタ クォーラム ロジックによると、2 つのスイッチが構成されているクラスタは、両方のスイッチが動作している場合、または小さい方のノード ID を持つスイッチが動作している場合に、動作できます。

後者の場合、小さい方のノード ID を持つスイッチが 1 スイッチ クラスタのマスターになります。このことは、もう一方のスイッチに障害が発生したか、単に動作中のスイッチへの接続が失われた場合に生じます。いずれの場合も、ノード ID が大きい方のスイッチが動作不能になります。ノード ID が小さい方のノードに障害が発生した場合、もう一方のスイッチは動作可能なクラスタを形成できません。

次の例では、これらのシナリオについて説明します。最初の 3 つの例では、単一スイッチの障害を考慮します。

  1. スイッチ S1(ノード ID 1)と S2(ノード ID 2)の 2 スイッチ クラスタで、S1 がマスターであると仮定します(マスターのノード ID が小さい)。

    スイッチ間の接続が失われた場合、マスター スイッチ S1 はノード ID が小さく、(N/2)スイッチ クラスタを形成できるため、引き続き動作します。スイッチ S2 が動作不能になります。

  2. スイッチ S1(ノード ID 1)と S2(ノード ID 2)の 2 スイッチ クラスタで、S2 がマスターであるとします(両方のスイッチがオンラインになったときの最新の設定を保持しているため、マスターのノード ID が大きいことに注意してください)。

    スイッチ間の接続が失われると、スイッチ S2 が動作不能になり、S1 がマスターを引き継いで、1 スイッチ クラスタを形成します。これは、2 スイッチ クラスタ(小さい方のノード ID を持つ N/2)のクォーラム ロジックと一致します。

  3. スイッチ S1(ノード ID 1)と S2(ノード ID 2)がある 2 スイッチ クラスタになっているとします。S1 に障害が発生した場合(どのスイッチがマスターであったかに関係なく)、S1 がダウンしている限り、S2 も動作不能になります。

    S1 が起動すると、S1 と S2 は 2 スイッチクラスタを形成します。

次の一連の例では、両方のスイッチ(ノード ID 1 の S1 とノード ID 2 の S2)のリブートについて説明します。


Caution


クラスタで構成を変更する場合は、すべてのスイッチをリブートする前に、 copy running-config startup-config CLI コマンドを入力して、実行構成をスタートアップ構成に保存する必要があります。そうしないと、リブート後にクラスタが正しく形成されない可能性があります( 例 3 を参照)。


  1. リブート後、スイッチ S1 と S2 の両方がほぼ同時に起動すると、2 スイッチクラスタが形成されます。
    1. クラスタ構成が同じ場合、S1(ノード ID が小さい方)がマスターになります。
    2. クラスタ設定が異なる場合は、最新のクラスタ構成を持つスイッチがマスターになります。
  2. リブート後、スイッチ S2 が先に起動すると、S1 も起動するまでクラスタを形成できません。その後、前のケースで説明したアルゴリズムが使用されます。
  3. リブート後、スイッチ S1 が最初に起動すると、1 スイッチクラスタ(小さい方のノード ID を持つ N/2)が形成されます。S2 が起動すると、クラスタに参加して 2 スイッチクラスタを形成します。

S2 が起動し、スタートアップ構成に最新のクラスタ構成がある場合(S1 のスタートアップ構成に実行構成を保存せず、S2 で保存した場合にそうなる可能性があります)、S1 によって形成されたクラスタには参加できません。


Caution


リブートする前に、すべてのスイッチで実行構成を保存することが重要です。


3 スイッチ クラスタのシナリオ

3 スイッチ クラスタでは、クォーラムにで 2 つのスイッチがクラスタ ビューに表示される必要があります(N/2 + 1)。次の例では、スイッチ S1(ノード ID 1)、S2(ノード ID 2)、および S3(ノード ID 3)を使用した 3 スイッチ クラスタの 3 つのシナリオについて説明します。S1 はマスター スイッチです。

  1. 3 スイッチ動作クラスタで、スイッチ S3 に障害が発生するか、他の 2 つのスイッチとの接続が失われると、S3 は動作不能になります。スイッチ S1 と S2 は動作クラスタを形成します。S3 が再び起動すると、クラスタに再度参加します。
  2. 3 スイッチ動作クラスタで、マスター スイッチ S1 に障害が発生するか、他の 2 つのスイッチとの接続が失われると、S1 は動作不能になります。スイッチ S2 と S3 は動作クラスタを形成し、S2 がマスターになります。S1 が再び起動すると、クラスタに再度参加します。S2 が引き続きマスターであることに注意してください。
  3. 2 つのスイッチに障害が発生すると、クラスタは動作不能になります。

次に、クラスタ内のすべてのスイッチでのリブートの例を示します。


Caution


クラスタで何らかの構成を変更する場合は、すべてのスイッチをリブートする前に、copy running-config startup-config コマンドを入力して実行構成をスタートアップ構成に保存する必要があります。そうしないと、リブート後にクラスタが正しく形成されない可能性があります。


  1. リブート後、すべてのスイッチがほぼ同時に起動した場合、最初に 2 スイッチ クラスタが形成され、その後 3 番目のスイッチが追加されます。
    1. クラスタ構成が同じ場合、S1(ノード ID が小さい方)がマスター スイッチになり、最初に 2 スイッチ クラスタを形成します。 それから 3 番目のスイッチが追加されます。
    2. クラスタ構成が異なる場合は、最新の構成を実行しているスイッチがマスター スイッチになり、2 スイッチ クラスタを形成します。それから 3 番目のスイッチが追加されます。
  2. リブート後にスイッチが 1 つずつ起動すると、最初の 2 つのスイッチが起動した後に 2 スイッチ クラスタが形成されます。その後、3 番目のスイッチがオンラインになると、クラスタに参加します。

    3 番目のスイッチがスタートアップ構成で最新のクラスタ構成を実行している場合、3 番目のスイッチはクラスタに参加できません。これは、実行構成をこのスイッチだけに保存し、他の 2 つのスイッチには保存していない場合に発生する可能性があります。


Caution


リブートする前に、すべてのスイッチで実行構成を保存することが重要です。


4 スイッチ クラスタのシナリオ

4 スイッチ クラスタのシナリオは、上記の例と非常によく似ています。クラスタ ビューに少なくとも 3 つのスイッチがある場合(N/2 + 1)、またはクラスタ ビューに最小のノード ID を持つスイッチを含む 2 つのスイッチがある場合(最小ノード ID の N/2)、クラスタは動作します。

2 ノード クラスタでのインサービス ソフトウェア アップグレード(ISSU)

インサービス ソフトウェア アップグレード(ISSU)は、トラフィックを中断することなく、バグ修正を展開し、新しい機能やサービスを追加できる、包括的で透過的なソフトウェア アップグレード アプリケーションです。

ノードとして MDS 9222i スイッチを含むクラスタでは、ノードが通信できない場合、最小のノード識別子(ノード ID)を持つノードがクラスタに残り、他のノードはクラスタから脱退します。ただし、最小のノード識別子を持つノードで ISSU が実行されると、両方のノードがクラスタから離れるため、クラスタが完全に失われます。

2 ノード クラスタでは、この望ましくない状況に、次のように対処できます:
  • アップグレードするノードが、クラスタを離れる意図のメッセージを他のノードに送信します。アップグレードするノードは、マスターノードまたはスレーブノードのいずれかです。
  • 残りのノードはクラスタに残り、それがスレーブノードであればマスターノードのロールを実行します。このノードは、クォーラムを維持したままクラスタに残ります。
  • ISSU が完了し、スイッチが起動すると、アップグレードされたノードがスレーブ ノードとしてクラスタに再参加します。

Note


この機能は ISSU ロジックに関連付けられており、追加のコマンドを実行する必要はありません。

サポートされるトポロジ

Cisco IOA は、単一ファブリック トポロジをサポートします。ファイバチャネル ファブリックに複数のモジュールを展開して、パフォーマンスを簡単にスケールアップし、負荷分散を簡素化し、可用性を向上させることができます。一般的な構成では、各 IOA クラスタのサイトごとに、1 つの IOA エンジンが必要です。

IOA クラスタには、指定されたバックアップ サーバー、テープ ライブラリ、および Cisco SAN-OS リリース 3.2(2c) 以降を実行する 1 つ以上の MDS スイッチが含まれます。サイトごとに、1 つのクラスタ スイッチに IOA エンジンを含める必要があります。使いやすいプロビジョニングなので、ファブリック上の任意のホストとテープ間のトラフィックで IOA サービスを利用できます。

必要な Cisco IOA エンジンは、次の Cisco 製品に含まれています。

  • Cisco MDS 9000 ファミリ 18/4 ポート マルチサービス モジュール(MSM-18/4)
  • Cisco SSN-16 モジュール スイッチ

単一ファブリックのトポロジ

MSM-18/4 モジュールは、ファブリック内の任意の場所に配置できます。Cisco IOA は、ホストからターゲットへの情報を 1 対 1 でマッピングし、暗号化されたデータを専用の HR テープに転送します。また、Cisco IOA は、暗号化された各テープのバーコードを追跡し、そのバーコードをホスト サーバーに関連付けます。

暗号化および圧縮サービスは、ホストおよびストレージ デバイスに対して透過的です。これらのサービスは、物理ファブリック内の任意の仮想 SAN(VSAN)内のデバイスで使用でき、再ゾーン化せずに使用できます。

特定のトポロジでは、エッジ スイッチは WAN を介して相互接続されます。最適なルーティングを実現するために、コアでの展開と WAN リンクのコアスイッチへの移行を計画してください。

クラスタ リカバリのシナリオ

Cisco IOA クラスタ内の 1 台以上のスイッチがオフラインの場合、またはマスター スイッチの割り当てをスイッチ間で変更する場合に使用するリカバリ手順については、このセクションを参照してください。

このセクションは、次のトピックで構成されています。

Cisco IOA クラスタからオフライン スイッチを削除する

1 つ以上のスイッチがオフラインで、マスター スイッチがオンラインの場合にオフライン スイッチを削除するには、次の手順に従います。

Procedure


Step 1

switch# configure terminal

コンフィギュレーション モードに入ります。

Step 2

switch(config)# ioa cluster ABC

IOA クラスタ モードを開始します。

Step 3

switch(config-ioa-cl)# shutdown

オフライン スイッチの ABC クラスタをシャットダウンします。

Note

 

すべてのオフライン スイッチで手順を繰り返します。

Step 4

switch(config-ioa-cl)# no node switch 2

ABC クラスタ構成から switch2 を削除します。

Note

 

ステップ 3 でシャットダウンしたすべてのオフラインスイッチに対して、この手順を繰り返します。

Step 5

switch(config-ioa-cl)# exit

IOA クラスタ モードを終了し、グローバル構成モードを開始します。

Step 6

switch(config)# no ioa cluster ABC

ABC クラスタ構成を削除します。

Note

 
最初の手順でシャットダウンしたすべてのオフライン スイッチでクラスタを削除します。

マスター スイッチがオンラインのときに、1 つ以上のオフライン スイッチがある Cisco IOA クラスタを削除する

1 つ以上のオフライン スイッチとオンライン マスター スイッチを含む Cisco IOA クラスタを削除するには、次の手順に従います。


Caution


クラスタ マスター スイッチをクラスタから削除してから、オフライン スイッチでクラスタを復活させようとしないでください。オフラインのスイッチは動作中のクラスタの一部ではなかったため、クラスタ マスターがオフラインのスイッチの状態と一致しない可能性があります。クラスタ マスターを削除し、オフライン スイッチでクラスタを復活させると、設定が古くなる可能性があります。


Procedure


Step 1

switch# configure terminal

コンフィギュレーション モードに入ります。

Step 2

switch(config)# ioa cluster ABC

IOA クラスタ モードを開始します。

Step 3

switch(config-ioa-cl)# shutdown

オフライン スイッチの ABC クラスタをシャットダウンします。

Note

 

すべてのオフライン スイッチで手順を繰り返します。

Step 4

switch(config-ioa-cl)# no node switch2

ABC クラスタ構成から switch2 を削除します。

Note

 

ステップ 3 でシャットダウンしたすべてのオフラインスイッチに対して、この手順を繰り返します。

Step 5

switch(config-ioa-cl)# exit

IOA クラスタ モードを終了し、グローバル構成モードを開始します。

Step 6

switch(config)# no ioa cluster ABC

ABC クラスタ構成を削除します。

Note

 
最初の手順でシャットダウンしたすべてのオフライン スイッチでクラスタを削除します。

すべてのスイッチがオフラインの場合に Cisco IOA クラスタを削除する

マスタースイッチおよび他のすべてのスイッチがオフラインのときに Cisco IOA クラスタを削除するには、次の手順に従います。


Note


すべてのスイッチがオフラインの場合、クラスタはオフラインです。

オフラインのスイッチ(たとえば switch2)で、次の操作を実行してクラスタをシャットダウンします。

Procedure


Step 1

switch# configure terminal

コンフィギュレーション モードに入ります。

Step 2

switch(config)# ioa cluster ABC

IOA クラスタ モードを開始します。

Step 3

switch(config-ioa-cl)# shutdown

オフライン スイッチの ABC クラスタをシャットダウンします。

Note

 

すべてのオフライン スイッチで手順を繰り返します。

Step 4

switch(config-ioa-cl)# exit

IOA クラスタ モードを終了し、グローバル構成モードを開始します。

Step 5

switch(config)# no ioa cluster ABC

ABC クラスタ構成を削除します。

Note

 
最初の手順でシャットダウンしたすべてのオフライン スイッチでクラスタを削除します。

Cisco IOA クラスタを復活させる

最新の Cisco IOA 構成バージョンを持つスイッチでクラスタを復活させるには、次の手順に従います。

この手順は、1 つ以上のスイッチがオフラインであり、クラスタが動作していない場合(クォーラムの損失などにより)、クラスタを復活させるために使用します。回復手順には、1 つ以上のオフラインスイッチを削除してから、残りのスイッチでクラスタを復活させることが含まれます。


Caution


Cisco IOA クラスタは、 show IOA cluster detail コマンドで表示される最新の IOA 構成バージョンを使用しているスイッチ上でのみ復活させる必要があります。構成バージョンが最新でないスイッチでクラスタを復活させると、構成が古くなる可能性があります。



Note


次の手順では、switch1 に最新の IOA 構成バージョンがあることを前提としています。switch2 に示されている手順は、クラスタを復活させる前に削除する必要があるすべてのスイッチに対して実行する必要があります。

Procedure


Step 1

switch# configure terminal

コンフィギュレーション モードに入ります。

Step 2

switch(config)# ioa cluster ABC

IOA クラスタ モードを開始します。

Step 3

switch(config-ioa-cl)# shutdown

オフライン スイッチの ABC クラスタをシャットダウンします。

Step 4

switch(config-ioa-cl)# exit

IOA クラスタ モードを終了し、グローバル構成モードを開始します。

Step 5

switch(config)# no ioa cluster ABC

ABC クラスタ構成を削除します。

Note

 
最初の手順でシャットダウンしたすべてのオフライン スイッチでクラスタを削除します。

Step 6

switch(config)# ioa cluster ABC

IOA クラスタ モードを開始します。

Step 7

switch(config-ioa-cl)# no node switch 2

ABC クラスタ構成から switch2 を削除します。

Note

 

削除する必要があるスイッチごとに繰り返します。

Step 8

switch(config-ioa-cl)# no shutdown

スイッチのクラスタを再起動します。