Cisco Nexus 1000V インタークラウド ハイ アベイラビリティおよび冗長性コンフィギュレーション ガイド リリース 5.2(1)IC1(1.1)
概要
概要
発行日;2013/12/03   |   ドキュメントご利用ガイド   |   ダウンロード ;   この章 pdf   ,   ドキュメント全体 pdf    |   フィードバック

概要

この章は、次の項で構成されています。

ハイ アベイラビリティに関する情報

ハイ アベイラビリティ(HA)の目的は、システム内で発生したハードウェアの障害およびソフトウェアのエラーの両方による影響を一定範囲内に抑えることです。 Cisco NX-OS オペレーティング システムは、ネットワーク レベル、システム レベル、およびサービス レベルでのハイ アベイラビリティに向けて設計されています。

次の Cisco NX-OS 機能が、障害発生時のトラフィックの中断を防止または最小限に留めます。

  • 冗長性:ソフトウェア アーキテクチャのあらゆる面での冗長性。
  • プロセスの分離:1 つのプロセス内で発生したエラーで他のプロセスが中断されるのを防ぐためのソフトウェア コンポーネント間の分離。
  • 再起動性:ほとんどのシステム機能およびサービスが分離されているため、エラーが発生しても、他のサービスは実行され続けている中で独立して再起動が可能。 さらに、ほとんどのシステム サービスはステートフルな再起動を実行するため、その他のサービスに対して透過的に稼働を再開できます。

システム コンポーネント

Cisco Nexus 1000V InterCloudは、次のコンポーネントで構成されています。

  • Cisco Prime Network Controller
  • Cisco Nexus 1000V InterCloud仮想スーパーバイザ モジュール(VSM)
  • インタークラウド スイッチ
  • インタークラウド エクステンダ
  • VSM 内でモジュールとして表される仮想イーサネット モジュール(VEM)
  • VMware vCenter サーバなどのリモート管理コンポーネント。

さまざまなシステム コンポーネントに関する詳細情報については、『Cisco Nexus 1000V InterCloud Installation Guide』を参照してください。

インタークラウド リンク

Cisco Nexus 1000V InterCloud は、インタークラウドの冗長リンクによるシステム レベルのハイ アベイラビリティ ソリューションを提供します。 インタークラウド リンクは、企業とパブリック クラウドの間のセキュアな接続です。 セキュアなレイヤ 2 トンネルにより、インタークラウド エクステンダとインタークラウド スイッチを接続して、企業ネットワークをクラウドに拡張します。 インタークラウド リンクは、企業内のインタークラウド エクステンダと、パブリック クラウド内のインタークラウド スイッチからなる単一のユニットと見なされます。

サービスレベル ハイ アベイラビリティ

プロセスの分離

Cisco NX-OS ソフトウェアには、「サービス」として知られる独立したプロセスがあります。サービスはサブシステムまたはフィーチャ セットの機能または機能セットを実行します。 各サービスおよびサービス インスタンスは、独立した保護プロセスとして実行されます。 このアプローチにより、高いフォールトトレラントを備えたソフトウェア インフラストラクチャとサービス間での障害の分離を実現できます。 サービス インスタンスに障害が発生しても、その時点で実行されている他のサービスに影響しません。 また、サービスの各インスタンスは独立したプロセスとして実行できます。つまり、ルーティング プロトコルの 2 つのインスタンスは別々のプロセスとして実行できます。

プロセスの再起動性

Cisco NX-OS のプロセスは、保護メモリ領域内で互いに独立して、またカーネルとも独立して動作します。 このようにプロセスが分離されているため、障害が閉じこめられ、迅速な再起動が可能になります。 プロセスの再起動性により、プロセスレベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。 また、大半のサービスはステートフルな再起動を実行できます。 これにより、プラットフォーム内の他のサービス、およびネットワーク内の隣接デバイスへ透過的に、障害の発生したサービスを再起動し、動作を再開できます。

システムレベル ハイ アベイラビリティ

Cisco Nexus InterCloud 1000V は、プライマリとセカンダリの冗長インタークラウド リンクを HA ペアとして実行することをサポートします。 デュアル インタークラウド リンクは、アクティブ/スタンバイ構成で動作します。常に、どちらか一方のインタークラウド リンクだけがアクティブ状態にあり、もう一方のモジュールはスタンバイ バックアップとして機能します。 インタークラウド リンクは Cisco Nexus 1000V インタークラウドのインストール中にプライマリまたはセカンダリとして設定されます。

冗長マネージャ

冗長マネージャは、ゲートウェイ内およびゲートウェイ間のハイ アベイラビリティ機能を管理して、システム レベルのハイ アベイラビリティ ソリューションを提供する、Cisco Nexus 1000V インタークラウドのサービスです。 各ゲートウェイ内の冗長マネージャはピア ゲートウェイと通信し、システムが健全な状態であることを保障します。

インタークラウド エクステンダのハイ アベイラビリティのハンドシェイク

Cisco Nexus 1000V InterCloud HA モデルでは、企業内のインタークラウド エクステンダとプロバイダー クラウド内のインタークラウド スイッチとは、合わせて単独のユニットとして見なされます。 HA 配置、実行中のインタークラウド リンクでの障害の影響を最小限に抑えるために、スタンバイ状態の 2 つめのリンクが存在します。

HA モードでは、2 つのインタークラウド リンクがシステムに導入されます。 インスタンス化中、Cisco Prime Network Services コントローラは各インタークラウド エクステンダに HA ロール(プライマリまたはセカンダリ)を割り当てます。 いったんローカルおよびピア情報で設定され、サイトツーサイト トンネルが確立されると、インタークラウド エクステンダは UDP ポート 9984 でハンドシェイクを実行します。 最初のハンドシェイクでは、インタークラウド エクステンダはどちらをアクティブ ステートまたはスタンバイ ステートに移す必要があるか、HA ロールを使用して決定します。 通常、プライマリ HA ロールのインタークラウド エクステンダがアクティブになり、セカンダリ HA ロールのインタークラウド エクステンダがスタンバイになります。

ただし、最初のハンドシェイク中にプライマリのインタークラウド エクステンダと通信できない場合、セカンダリのインタークラウド エクステンダがアクティブになる可能性があります。 この場合プライマリは、アップしてセカンダリ インタークラウド エクステンダとハンドシェイクを実行すると、スタンバイ状態になります。

アクティブなインタークラウド リンクで障害が発生すると、スタンバイのインタークラウド リンクがアクティブ状態に移行し、障害が発生したインタークラウド リンクはリブートし、スタンバイ状態に移行します。

インタークラウド エクステンダのハイ アベイラビリティのハートビート

ハンドシェイクがインタークラウドのプライマリおよびセカンダリ エクステンダの間で発生すると、データを共有するため、またシステムが健全な状態であることを保証するために、ハートビートを交換します。 ハンドシェイクと同様に、ハート ビートは UDP ポート 9984 で送受信されます。

ハート ビートはローカルやピアの状態、コントロール フラグ、およびトンネル ステータスなどが含まれ、各インタークラウド エクステンダの冗長マネージャがシステム全体の健全性についてインテリジェントな判断をすることが可能になります。

次の間隔が、ハートビート メッセージを送信する場合に適用されます。

インターバル

説明

5 秒

ハートビート要求が送信される間隔。

35 秒

ハートビートの欠落が管理インターフェイスでの通信劣化を示すまでの間隔で、これによりハートビートがサイトツーサイトのセキュアなトンネルおよびインタークラウド スイッチ経由でも送信されるようにします。

300 秒

WAN 接続の問題が発生した場合に、スタンバイのインタークラウド リンクがリロードされるまでの間隔。 これにより、両方のインタークラウド エクステンダに障害が発生して WAN 接続の問題を誤検出する結果になる可能性を防止します。

240 秒

トンネル マネージャがハートビートの欠落のためにサイトツーサイトのセキュアなトンネルの破棄を宣告するまでの間隔。 スタンドアロン モードでは、インタークラウド エクステンダとインタークラウド スイッチの両方が再起動されます。 HA モードでは、スイッチオーバーが発生し、障害が発生したインタークラウド リンクが再起動し、スタンバイ状態として回復します。

管理およびトンネル インターフェイスの冗長性

アクティブなインタークラウド エクステンダは、ハートビート要求をスタンバイのインタークラウド エクステンダに送信し、スタンバイのインタークラウド エクステンダは応答を送信します。 スタンバイのインタークラウド エクステンダは、ハートビート要求を 30 秒間受信しなかった場合、アクティブなインタークラウド エクステンダに明示的な要求を送信します。 応答がない場合、スタンバイのインタークラウド エクステンダは、インタークラウド リンク内のインタークラウド スイッチ経由でハートビート要求を送信し、それからアクティブなインタークラウド リンク内の HA ピア インタークラウド スイッチに転送し、最後に目的のアクティブなインタークラウド エクステンダに転送します。

応答が受信されると、インタークラウド エクステンダはインタークラウド エクステンダ間の接続問題の検出を説明するログを出力します。 応答が受信されない場合、スタンバイのインタークラウド エクステンダはスイッチオーバーを開始します。 その結果、スタンバイのインタークラウド リンクがアクティブ状態に移行し、障害が発生したインタークラウド リンクは再起動され、スタンバイ状態で起動します。


(注)  


いずれかのゲートウェイ間で制御接続が失われた場合、冗長ハート ビート メカニズムは失敗します。 2 個の冗長ハート ビート要求が 5 秒にわたって失敗する場合、ソース インタークラウド エクステンダは HA ピア インタークラウドに障害が発生したと見なします。


スプリット ブレインの解決

インタークラウド エクステンダ、インタークラウド スイッチ、および Cisco Prime Network Services Controller の間で接続の問題が発生した場合、両方のインタークラウド エクステンダがアクティブ ロールとなる可能性があります。 この状態はアクティブ-アクティブまたはスプリット ブレイン状態と呼ばれます。 システム内の通信が回復すると、インタークラウド エクステンダは、再起動された場合にシステムへの影響が小さいのはどちらかを判定するために情報を交換します。

インタークラウド エクステンダの接続が失われただけでスプリット ブレインが発生することはありません。スタンバイのインタークラウド エクステンダがハートビート障害のためにアクティブになるときには、障害の発生したインタークラウド リンクを再起動するよう Cisco Prime Network Services Controller に要求を送信するからです。 障害の発生したインタークラウド リンクは、起動するとスタンバイ状態に移行します。

スプリット ブレインが発生する可能性があるシナリオは、Cisco Prime Network Services Controller と、アクティブに移行中のスタンバイ インタークラウド エクステンダとの接続が失われる場合です。 この場合、障害の発生したインタークラウド リンク内のゲートウェイが再起動されず、アクティブ-アクティブのシナリオが発生します。

アクティブ-アクティブのシナリオが発生すると、ハンドシェイク解決時に次のパラメータを検討します。

  • 送信されたハートビート:一定のしきい値内でより多くのハートビートを送信したインタークラウド エクステンダがアクティブのままになります。 送信されたハート ビートの違いがあまりない場合、解決は HA ロールに基づきます。
  • HA ロール:HA ロールがプライマリのインタークラウド エクステンダがアクティブのままになります。

スタンバイ状態に移行するインタークラウド リンクは、プラットフォーム コンポーネントの多くがアクティブからスタンバイへの遷移をサポートしていないため、再起動されます。 再起動されたインタークラウド リンクは、アクティブなインタークラウド エクステンダとのハンドシェイク実行後、スタンバイに移行します。