Cisco Catalyst 6500 シリーズ

Cisco Catalyst 6500のNSF/SSO(ノンストップ フォワーディング/ステートフル スイッチオーバー)

ダウンロード
Cisco Catalyst 6500のNSF/SSO(ノンストップ フォワーディング/ステートフル スイッチオーバー)

ホワイト ペーパー


Cisco Catalyst 6500のNSF/SSO(ノンストップ フォワーディング/ステートフル スイッチオーバー)


Cisco® Catalyst® 6500は、企業ネットワークとサービス プロバイダー ネットワークの要所に数多く展開されています。Cisco Catalyst 6500はネットワーク内できわめて重要な位置に設置されているため、100%に近いアベイラビリティを実現する必要があります。Cisco Catalyst 6500のプラットフォームは何年にもわたって進化し続け、高度な復元メカニズムを提供することにより、より高レベルのアベイラビリティを実現することを可能にしました。ハイ アベイラビリティ メカニズムの例としては、冗長スーパーバイザ、冗長スイッチと冗長リンク、Cisco EtherChannel®テクノロジー、Spanning-Tree Protocol(STP;スパニングツリー プロトコル)、Unidirectional Link Detection(UDLD;単一方向リンク検出)プロトコル、Hot Standby Router Protocol(HSRP)、Gateway Load Balancing Protocol(GLBP)、およびルーティング プロトコルの等コスト パスなどがあります。このハイ アベイラビリティ機能に追加された最新機能が、Nonstop Forwarding(NSF;ノンストップ フォワーディンブ)/Stateful Switchover(SSO;ステートフル スイッチオーバー)です。NSF/SSOは、Cisco IOS®ソフトウェア リリース12.2(18)SXDでSupervisor Engine 2とSupervisor Engine 720に導入されたスーパーバイザの冗長メカニズムであり、レイヤ2~4のシャーシ内でのステートフル スイッチオーバーを提供します。NSF/SSOでは、スーパーバイザのスイッチオーバーがすばやく実行されるため、パケット損失は0~3秒程度で済み、Mean Time To Repair(MTTR;平均修復時間)が短縮されます。NSF/SSOは、企業ネットワークまたはサービス プロバイダーのネットワークの最重要部分に展開可能です。これはネットワーク内の終端ポイントに不可欠の機能であり、Voice over IP(VoIP)、映像、およびパケット損失の影響を受けやすいその他のアプリケーションが関与するネットワークのダウンタイムを最小限に抑えることができます。

本書では、Cisco IOSソフトウェアのCisco Catalyst 6500におけるNSF/SSOスーパーバイザの冗長動作について紹介します。NSF/SSOに関するプラットフォーム固有の詳細事項、NSF/SSOでサポートされている機能(Multicast Multilayer Switching [MMLS] NSF/SSOなど)、およびNSF/SSOのパフォーマンス実績を紹介します。本書では扱いませんが、NSF/SSOを備えたアベイラビリティの高いネットワークの設計方法を理解することは非常に重要です。ハイ アベイラビリティ キャンパス ネットワークの設計に関する情報、NSF/SSOの動作全般に関する詳細情報、NSF/SSOのコンフィギュレーション ガイド、Cisco Catalyst 6500のハイ アベイラビリティ メカニズムを網羅した完全なリスト、およびCisco Catalyst 6500のCisco Catalyst OS(オペレーティング システム)に関するスーパーバイザの冗長性に関する情報は、この文書の「参考資料」を参照してください。

スーパーバイザの冗長性

スイッチの冗長コンポーネント
Cisco Catalyst 6500シリーズ スイッチは、アベイラビリティの高いシステムを実現するための基盤として、冗長ハードウェア システム アーキテクチャが採用されています。Cisco Catalyst 6500スイッチでは、次のコンポーネントによってスイッチの冗長性を実現しています。

  • スーパーバイザ エンジン ― すべてのCisco Catalyst 6500シャーシは、システムのハイ アベイラビリティを提供するため、冗長スーパーバイザ エンジンをサポートしています。スーパーバイザはアクティブおよびスタンバイ モードで動作し、フェールオーバーのためのさまざまな冗長メカニズムをサポートしています。
  • スイッチ ファブリック ― スイッチ ファブリックは、ファブリック対応のライン カードにデータ パスを提供し、使用可能なシステム帯域幅を共有バス キャパシティの32 Gbpsから、SFM2(スイッチ ファブリック モジュール2)搭載のSupervisor Engine 2では256 Gbps、Supervisor Engine 720では720 Gbpsに増やします。スイッチ ファブリックに障害が発生した場合は、冗長スイッチ ファブリックに切り替わります(冗長ファブリックが存在する場合)。
  • 電源装置 ― すべてのCisco Catalyst 6500シャーシでは、冗長電源装置がサポートされているので、1台の電源装置に障害が発生しても動作に影響はありません。
  • ファン トレイ ― 各ファン トレイには複数のファンがあります。また、Cisco Catalyst WS-C6509-NEB-Aシャーシには、オプションの冗長ファン トレイが用意されています。
  • ライン カードのOnline Insertion and Removal(OIR;ホットスワップ) ― システムに影響を与えることなく新しいモジュールを追加でき、ライン カードを交換しても設定が失われません。ローカル フォワーディング エンジンを備えたモジュール(Distributed Forwarding Card [DFC])を取り付けると、ローカル フォワーディング エンジンのハードウェア テーブルには、最新のフォワーディング情報が読み込まれます。


スーパーバイザの冗長性の定義
スーパーバイザの冗長性をCisco Catalyst 6500で実現するには、以下が必要です。

  • シャーシあたり2台のスーパーバイザ
  • 2台のスーパーバイザ間で情報を同期させる冗長プロトコル


最初に起動したスーパーバイザ エンジンが、アクティブ スーパーバイザ エンジンになります。アクティブ スーパーバイザでは、コントロール プレーンとフォワーディングの決定が実行されます。もう1台のスーパーバイザはスタンバイ スーパーバイザとなり、コントロール プレーンまたはデータ プレーンの決定には参加しません。アクティブ スーパーバイザは、設定とプロトコルのステート情報をスタンバイ スーパーバイザと同期させます。そのため、アクティブ スーパーバイザに障害が発生した場合は、スタンバイ スーパーバイザでただちにアクティブ スーパーバイザの役割を引き継ぐことができます。アクティブ スーパーバイザからスタンバイ スーパーバイザへの「交代」のプロセスは、スイッチオーバーと呼ばれます。

一度にアクティブにできるスーパーバイザは1台だけであり、冗長化した場合でも、スーパーバイザ エンジン間の負荷分散は行われません。ただし、スタンバイ スーパーバイザ エンジンが動作しているときは、インターフェイスがアクティブになっているため、トラフィックのフォワーディングに使用することができます。

スーパーバイザの冗長動作
スーパーバイザの冗長動作は、Route Processor Redundancy(RPR)とRPR plus(RPR+)から、Single Router Mode(SRM)/SSO、そしてNSF/SSOへと発展してきました。それぞれの冗長動作モードは、以前よりも機能が向上しています。

  • RPR - RPRは、Cisco IOSソフトウェアに初めて導入された冗長動作モードです。RPRモードでは、スタートアップ コンフィギュレーションとブート レジスタがアクティブ スーパーバイザとスタンバイ スーパーバイザ間で同期化されます。ただし、スタンバイ スーパーバイザは完全には初期化されず、両方のスーパーバイザ間のイメージは同一である必要がありません。スイッチオーバーが発生すると、スタンバイ スーパーバイザは自動的にアクティブになりますが、ブート プロセスを完了させなければなりません。さらに、すべてのライン カードがリロードされ、ハードウェアが再プログラミングされます。RPRでのスイッチオーバーには、2分以上の時間がかかります。
  • RPR+ - RPR+はRPRの強化版です。スタンバイ スーパーバイザは完全に起動されていて、スイッチオーバーが発生してもライン カードのリロードは行われません。ランニング コンフィギュレーションはアクティブ スーパーバイザとスタンバイ スーパーバイザ間で同期化されます。また、RPRで行われる同期化動作のすべてが実行されます。同期化はスイッチオーバーの前に完了し、スタンバイ スーパーバイザがアクティブになったときには同期化された情報が使用されるので、ダウンタイムが最小限に抑えられます。ただし、リンク層またはコントロール プレーンの情報の同期化は行われません。インターフェイスはスイッチオーバー後にただちに復旧し、ハードウェア情報は再プログラミングされます。RPR+によるスイッチオーバーには30秒以上の時間がかかります。
  • SRM/SSO - SSOはRPR+の機能をさらに拡張し、スーパーバイザに障害が発生した場合にレイヤ2プロトコルのトランスペアレントなフェールオーバーを提供します。SSOはレイヤ2プロトコルについてステートフルとなっています。Policy Feature Card(PFC;ポリシー フィーチャ カード)とDFCのハードウェア テーブルは、スイッチオーバーが発生しても維持されます。これにより、レイヤ2およびレイヤ4でトランスペアレントなフェールオーバーが可能になります。SSOは、SRM/SSOおよびNSF/SSOの要件です。SRMおよびNSFは追加のレイヤ3ルーティング機能を提供するもので、SSOはSRMおよびNSFとは独立して使用できます。SRM/SSOを使用しているときにスイッチオーバーが発生すると、ルーティング プロトコルは再起動します。ただし、SRM/SSOは、設定可能なルート コンバージェンス間隔の間、既存のPFCおよびDFCのレイヤ3スイッチング情報を使用してトラフィックを転送します。この間に、新しくアクティブになったMultilayer Switch Feature Card(MSFC;マルチレイヤ スイッチ フィーチャ カード)は、独自のルーティング テーブルを構築します。これにより、ダウンタイムは最小限に抑えられますが、スーパーバイザに障害が発生するとピアでは再コンバージェンスが必要です。SRM/SSOのスイッチオーバーにかかる時間は、レイヤ2のユニキャスト トラフィックで0~3秒です。
  • NSF/SSO - NSFはSSOと連携して動作し、スイッチオーバー後のレイヤ3の完全性を保証します。これによって、ルータはアクティブ スーパーバイザに障害が発生しても既知のルートでデータ パケットの転送を継続することができ、その間にルーティング プロトコル情報が回復され、検証が行われます。再起動するルータで近接ルータとのピアリング アレンジメントが失われた場合でも、転送を続行できます。NSFが機能するためには、スーパーバイザのスイッチオーバー中にコントロール プレーンとデータ プレーンが隔離されていることが必要です。データ プレーンは、スイッチオーバー以前のCisco Express Forwarding(CEF)の情報に基づいてパケット フォワーディングを継続します。コントロール プレーンにはグレースフル リスタート ルーティング プロトコル拡張機能が実装されており、スイッチオーバー後にスーパーバイザが再起動したことを近接するNSF認識ルータに通知して、ネイバ隣接関係を再編し、さらにルーティング プロトコル データベースを再構築します。NSF対応ルータにはNSF機能が実装されており、スーパーバイザに障害が発生したあともデータ パケットの転送を続行できます。NSF認識ルータは、NSFのグレースフル リスタート メカニズムに対応しています。NSF認識ルータは、再起動するNSF対応ルータとのネイバ関係を破棄せず、近接するNSF対応ルータの再起動を支援できるため、不要なルート フラップやネットワークの不安定が発生しにくくなります。NSF対応ルータもNSFを認識することができます。


MMLS NSF/SSOによって、システムはスーパーバイザ エンジンのスイッチオーバーの間、PFC3およびDFC3ハードウェア内のマルチキャスト フォワーディングの状態を維持できるので、マルチキャスト サービスの中断を最小限に抑えることができます。MMLS NSF/SSO以前は、マルチキャスト フォワーディング エントリはスタンバイ スーパーバイザ エンジンに同期化されていませんでした。NSF/SSOのスイッチオーバー時間は、レイヤ2~4のユニキャストまたはマルチキャスト トラフィックで0~3秒です。

表1に、Cisco Catalyst 6500でサポートされている各冗長モードに必要なソフトウェア バージョンの最低要件を示します。

表1 スーパーバイザの冗長モードのサポート

スーパーバイザ エンジン RPRおよびRPR+ SRM/SSO NSF/SSO
Supervisor Engine 1A 12.1(13)E - -
Supervisor Engine 2 12.1(13)Eまたは12.1(17d)SXB - 12.2(18)SXD
Supervisor Engine 720 12.2(14)SX 12.2(17b)SXAおよび12.2(17d)SXBのみ 12.2(18)SXD


2台のSupervisor Engine 720を使用する場合、デフォルトの冗長動作モードはSSOで、Cisco IOSソフトウェア リリース12.2(17b)SXA以降のリリースでサポートされています。2台のSupervisor Engine 2を使用する場合、デフォルトの冗長動作モードはSSOで、Cisco IOSソフトウェア リリース12.2(18)SXD以降のリリースでサポートされています。Cisco IOSソフトウェア12.2SXより以前のリリースでは、デフォルトの冗長動作モードはRPR+となります。

SRM/SSOは、Cisco IOSソフトウェア リリース12.2(17b)SXAおよび12.2(17d)SXBでは、デフォルトで有効になっています。SRM/SSOは、Cisco IOSソフトウェア リリース12.2(18)SXD以降ではNSF/SSOに置き換えられています。NSF認識とNSF機能を有効にする方法は、ルーティング プロトコルごとに異なります。NSF/SSOの設定の詳細については、次のURLを参照してください。
http://www.cisco.com/univercd/cc/td/doc/product/lan/cat6000/122sx/swcg/nsfsso.htm

ソフトウェアのアップグレード
SSOを機能させるには、各スーパーバイザ エンジンが同じリリースのCisco IOSソフトウェアを稼働していることが必要です。Fast Software Upgrade(FSU)を使用すれば、ソフトウェアのアップグレード計画に伴うダウンタイムを最小限に抑えることができます。このプロセスが行われている間、冗長モードはアップグレード中にRPRに戻ります。手順の詳細は次のURLに記載されています。
http://www.cisco.com/jp/service/manual_j/sw/cat60/iosscg/chapter07/07_redund.shtml#62923

RPR+またはSSO冗長モードで稼働するには、イメージのバージョンがアクティブ スーパーバイザとスタンバイ スーパーバイザとで同一である必要があります。これらの冗長モードでは、スタンバイ スーパーバイザ エンジンがオンラインになると、スタンバイ スーパーバイザ エンジンに搭載されているイメージのバージョンがアクティブ スーパーバイザ エンジンによってチェックされます。スタンバイ スーパーバイザ エンジンのイメージがアクティブ スーパーバイザ エンジンのイメージと一致しない場合は、ソフトウェアは冗長モードをRPRに切り替えてアップグレードを実行し、アップグレードが完了してからSSOに再度切り替えます。

将来のCisco In Service Software Upgrade(ISSU)では、SSO冗長モードでソフトウェアのアップグレードが可能になります。NSF/SSOはCisco ISSUの基本的な構成要素です。

スーパーバイザの障害検出
スーパーバイザの冗長性は、システムのハイ アベイラビリティの一部に過ぎません。ハードウェアおよびソフトウェアの障害を検出することが、復元力を備えたスーパーバイザのスイッチオーバー メカニズムを実現するための主要な要件となります。この障害検出のフレームワークを提供するのが、Generic Online Diagnostics(GOLD)とプラットフォーム依存の診断です。

GOLDは、シスコシステムズのプラットフォーム上の診断動作を行うための、共通のアーキテクチャを定義しています。GOLDはプラットフォーム固有のオンライン診断と連携して動作し、起動中および稼働中のシステムの健全性を保証するのに役立ちます。Cisco Catalyst 6500シリーズでは、情報の大部分がハードウェア ベースで処理されるため、ハードウェアの機能を定期的にテストすることが非常に重要です。Cisco Catalyst 6500システムでは、アクティブおよびスタンバイ スーパーバイザを含むほとんどのモジュールで障害検出診断メカニズムが有効になっています。診断テストの結果は、スイッチオーバーの決定に利用することができます。Cisco Catalyst 6500にはオンライン診断が組み込まれているため、スイッチオーバーのトリガーとなるものがソフトウェアのクラッシュやキープアライブ メカニズムのみに限定されません。スイッチオーバーは、スーパーバイザの制御パスとデータ パスに不整合や障害が生じた場合、またはランタイム診断でハードウェアの誤作動が検出された場合にも起動されることがあります。GOLDはスイッチオーバーの決定と起動に役立つだけでなく、スタンバイ スーパーバイザを定期的に監視して、スイッチオーバーのときにいつでも交代できることを保証します。GOLDには、スイッチオーバーのスケジューリング機能も組み込まれています。管理者は、オンライン診断CLI(コマンドライン インターフェイス)によって、スイッチオーバーが特定の時間に行われるようにスケジューリングすることができます。

GOLDでは、次の問題を検出してスーパーバイザのスイッチオーバーを決定することができます。

  • ハードウェア コンポーネントの障害
  • コネクタの障害
  • インターフェイスの障害
  • メモリ エラー
  • データ プレーンとコントロール プレーン間の不整合


SSO

SSOの動作
SSOの同期化動作
図1は、通常の動作時のSSOの同期化を図示したものです。SSOモードでは、レイヤ2プロトコルとPFCのハードウェア情報がアクティブ スーパーバイザからスタンバイ スーパーバイザへと同期化されます。この図では、RPはRoute Processor(RP;ルート プロセッサ)、SPはSwitch Processor(SP;スイッチ プロセッサ)、PFCはPolicy Feature Card(PC;ポリシー フィーチャ カード)、DFCはDistributed Forwarding Card(DFC;分散フォワーディング カード)を表します。

図1 SSOの同期化動作

SSOではRPR+の同期化機能が拡張され、レイヤ2およびレイヤ4でトランスペアレントなフェールオーバーが可能となっています。アクティブ スーパーバイザからスタンバイ スーパーバイザへの同期は、スタートアップ コンフィギュレーション、スタートアップ変数、およびランニング コンフィギュレーションだけでなく、ランタイム データにも適用されます。フェールオーバーの際にアクティブ スーパーバイザおよびスタンバイ スーパーバイザ上のピア プロトコル プロセス間で規則性と信頼性の高い通信を実現するため、このダイナミックなデータ同期化(チェック ポインティング)では、Cisco IOS Redundancy FacilityとCheckpoint Facilityを使用しています。起動時には、SSOのバルク同期化が実行されます。システムの稼働時にシステム内で変更が生じると、設定の同期化と状態のチェック ポインティングがさまざまなプロトコルで実行されます。

SSOは、レイヤ2のダイナミック プロトコルのランタイム データを同期化します。レイヤ2のコントロール プレーン、設定、その他のネットワーク関連の変更が生じると、アクティブ スーパーバイザおよびスタンバイ スーパーバイザ上のピア プロセス間で動作するCisco IOS Checkpoint Facilityが変更に関する情報を交換します。表2は、SSOでサポートされているレイヤ2プロトコルの一覧を示します。たとえば、スタンバイ スーパーバイザ上のSTPデータベースは、アクティブ スーパーバイザからのプロトコル情報とポート ステートの両方のチェック ポインティングを実行することによって最新の状態に維持されます。

SSOは、アクティブ スーパーバイザとスタンバイ スーパーバイザ間のハードウェア フォワーディング テーブルも同期します。PFCはスーパーバイザのドータカードであり、ハードウェア スイッチングを実行するApplication Specific Integrated Circuit(ASIC;特定用途向けIC)を搭載しています。ハードウェア テーブルの新しいエントリをPFCにダウンロードするときには、システム内の他のすべてのフォワーディング エンジンにも同時にダウンロードされます。これにより、スタンバイ スーパーバイザのPFCは、アクティブ スーパーバイザのPFCおよびDFCと同じフォワーディング情報を保持できます。MACアドレス テーブル、Forwarding Information Base(FIB;フォワーディング情報ベース)、隣接テーブル、Access Control List(ACL;アクセス制御リスト)、およびQuality of Service(QoS;サービス品質)のハードウェア テーブルの内容は、スイッチオーバー後のスイッチングの決定にも使用できます。

図2は、スーパーバイザのスイッチオーバー動作を図示したものです。スイッチオーバーが発生しても、トラフィックは混乱なく転送できます。1、2、3、4という番号は、スイッチオーバーの順番を表します。以下、これらのステップについての説明をします。

図2 スーパーバイザのスイッチオーバー動作

通常の動作時には、ハードウェア テーブルとレイヤ2プロトコルの状態が同期されています。図1には、SSO冗長モードでのスーパーバイザのスイッチオーバー動作が図示されています。スイッチオーバーのステップ1~4についての説明は、次のとおりです。

  1. システムによってアクティブ スーパーバイザでソフトウェアまたはハードウェアの障害が検出されると、スイッチオーバーが起動されます。障害は、ソフトウェアの例外ハンドラ、GOLDのバックグラウンド チェック、RPとSP間のキープアライブの失敗、Supervisor Engine 720でのファブリック スイッチング モジュールの状態変化などによって検出されます。また、スイッチオーバーはユーザによって起動される場合もあります。
  2. ライン カードの同期によって、システム内のすべてのモジュールでスイッチオーバーの発生が認識されます。スタンバイ スーパーバイザはアクティブ スーパーバイザの役割を引き受け、データは新たにアクティブになったスーパーバイザ上のPFCによって転送されます。
  3. 新たにアクティブになったスーパーバイザ上のSPとRPは、プロトコルとデータ パケットの処理を開始します。SSO認識プロトコルはスイッチオーバーの影響を受けず、ネットワークからのアップデート処理を開始します。
  4. 非SSO認識プロトコルとルーティング プロトコルが起動されます。SRM/SSOは、設定可能なルート コンバージェンス間隔が経過したあとにスイッチオーバー以前のFIB情報を除去するため、ルーティング プロトコルが収束されている間に、レイヤ3の転送をハードウェア内で継続できます。ピアでは障害の前後で再コンバージェンスが必要です。スタティック ルートは、動的ではなく静的な設定に基づいているため、スイッチオーバーの前後で維持されたままになります。QoSまたはACLポリシーから派生するサポート対象のレイヤ2制御プロトコルとレイヤ4ポリシーは、スイッチオーバーの影響を受けません。

NSF/SSO

NSF/SSOの動作
NSF/SSOの同期化動作

図3は、NSF/SSOによるスーパーバイザの同期化を図示したものです。

図3 NSF/SSOの同期化動作

シスコ製ルータでのパケット フォワーディングは、CEFによって実行されます。CEFは、FIBテーブルと隣接テーブルの2つテーブルを保持しています。FIBテーブルはルーティング テーブルから抽出して作成されたテーブルで、フォワーディング プロセスに関連する情報のみが含まれ、特定のルーティング プロトコルに関する情報は含まれません。

たとえば、ルーティング プロトコルのアドミニストレーティブ ディスタンスは、フォワーディング プロセスとは関連性がありません。隣接テーブルは、隣接ノードのネクストホップ リライト情報を集約したものです。

通常の動作時には、各ルーティング プロトコルで計算されたルートがシステムによってRouting Information Base(RIB;ルーティング情報ベース)という共通データベースに集約されます。すべてのルーティング プロトコルの情報がRIB内に存在するときは、RIBの情報に基づいて、各ネットワークおよびサブネットに対応する最低コストのネクストホップ宛先が決定されます。その時点で、最低コスト パスのルーティング プレフィクスと隣接情報がCEFテーブルに入力されます。ルーティング プロトコルに変更が生じると、ソフトウェアのCEFデータベースではアクティブ スーパーバイザからスタンバイ スーパーバイザへのチェック ポインティングが行われ、CEFテーブルがシステム内に存在するすべてのPFCおよびDFCのハードウェアにダウンロードされます(スタンバイPFCを含む)。これにより、フォワーディング テーブルの同期化がソフトウェアおよびハードウェア レベルで保証され、スイッチオーバー後も最も正確な最新のフォワーディング テーブル情報に基づいてフォワーディングが実行されることが保証されます。

新旧のCEFエントリを区別できるように、CEFエントリごとのエポック番号が割り当てられています。これは、FIBおよび隣接データベースのバージョニングと呼ばれています。エポック番号はソフトウェアのCEFテーブルのみに管理され、フォワーディング パスには影響しません。スイッチオーバーが発生すると、「グローバル エポック番号」の数値が1つ増えます。スイッチオーバー後、新たにアクティブになったスーパーバイザで新しいルーティング情報が入力されると、CEFエントリのバージョン番号はグローバル エポック番号によって更新されます。ルーティング プロトコルによってコンバージェンスの完了が通知されると、現在のエポックよりも前のバージョン番号を持つFIBおよび隣接エントリはクリアされます。

スーパーバイザのスイッチオーバー動作
スイッチオーバーの発生時に、NSFを正常に機能させるには、データ プレーンとレイヤ3のコントロール プレーンが隔離されていることが必要です。コントロール プレーンが新しいルーティング プロトコル データベースを構築し、ピアリング アグリーメントを再起動させるのに対して、データ プレーンはスイッチオーバー以前のフォワーディング テーブルの同期化に基づいてトラフィック フォワーディングを継続します。次の項では、NSF認識ネイバが存在することを前提としています。NSF認識ネイバによる支援がないと、NSF対応システムではスイッチオーバー中にデータベースを再構築することも、ネイバ隣接関係を維持することもできません(ただし、Cisco Intermediate System-to-Intermediate System [IS-IS]のNSF実装では、NSF認識ネイバは不要)。

スイッチオーバー動作は、図2で説明したとおりに発生します。ただし、NSF対応ルーティング プロトコルの再初期化によってルート フラップが発生することはありません。図4は、実行される汎用ルーティング プロトコルのNSF/SSOの動作について説明しています。図4は、近接するNSF認識ルータとNSF対応のCisco Catalyst 6500について図示しています。ここには、新たにアクティブになったCisco Catalyst 6500のスーパーバイザとNSF/SSO動作の手順が示されています。ただし、この図には障害を起こしたアクティブ スーパーバイザは含まれていません。スーパーバイザのSPとPFCに適用される手順は、ライン カード プロセッサとDFCにも適用されることに注意してください。

図4 NSF/SSOの動作

図4のステップ1~12についての説明は、次のとおりです。これらのステップは、すべて「新たにアクティブになった」スーパーバイザで実行されます。

  1. スイッチオーバーが起動されます。
  2. ルーティング プロトコルのプロセスによって、スーパーバイザのフェールオーバーが発生したことが通知されます。コントロール プレーンとデータ プレーンを隔離するため、ルーティング プロトコルの再コンバージェンスが実行されるまでFIBがRIBから隔離されます。
  3. パケット転送は、スタンバイ スーパーバイザへの切り替えが行われている間、既知の最新FIBおよび隣接エントリに基づいて継続されます。
  4. グローバル エポック番号の数値が1つ増えます。たとえば、スイッチオーバー以前にグローバル エポック番号が0であった場合は、1になります。
  5. スーパーバイザがコントロール プレーンのトラフィックの処理を開始します。
  6. ソフトウェアの隣接テーブルには、スイッチオーバー前のAddress Resolution Protocol(ARP)テーブルの内容が入力されています。アップデートされたCEFエントリに新しいグローバル エポック番号が付与されます。このエポック番号は、RPソフトウェアのCEFエントリでのみ使用可能で、ハードウェア テーブルには存在しません。ハードウェアには、新しい隣接エントリがダウンロードされます。
  7. ルーティング プロトコル固有のネイバおよび隣接関係の再取得が実行されます。再起動するNSF対応ルータは、そのネイバに対して、隣接関係が再取得されていること、およびNSF認識ネイバはネイバ関係を再初期化しないことを通知します。再起動の通知が受信されると、プロトコル固有の手順が実行されて隣接関係を維持できるようになります。ほとんどの場合、再起動の通知は、Helloパケットに再起動フラグを設定して、復旧プロセス中に短い間隔でHelloパケットを送信することによって行われます。また、NSF認識ネイバはNSF認識機能を持つことを、再起動するルータに通知することがあります。非NSF認識ネイバでは再起動の通知は無視され、隣接関係が停止されます。現在のNSFの実装では、複数のNSF可能ネイバの同時再起動はサポートされていません。
  8. ルーティング プロトコル固有のデータベース同期化が実行されます。ルーティング プロトコルのプロセスによって、NSF認識ネイバからのデータベース情報を利用してデータベースが再構築されます。
  9. ルーティング データベースが同期化されると、ディスタンス ベクタ、パス ベクタ、またはShortest Path First(SPF)アルゴリズムの計算によって、特定のプレフィクス宛先への最適ルートが決定されます。RIBには、新しいルーティング エントリが入力されます。対応するCEFエントリが更新されます。
  10. 更新された情報がソフトウェアのCEFデータベースに入力されると、更新されたエントリには、リフレッシュされたことを示すグローバル エポック番号が付与されます。対応するFIBエントリとハードウェア エントリが更新されます。
  11. 各ルーティング プロトコルは、CEFにコンバージェンスの完了を通知します。すべてのプロトコルでコンバージェンスが完了すると、最後のルーティング プロトコルは古くなったルートとの隣接情報を消去します。現在のグローバル エポック番号に該当しない番号を持つソフトウェアのCEFエントリは消去されます。対応するFIBおよび隣接ハードウェア エントリも消去されます。
  12. これで、RP上のCisco IOSソフトウェアのCEFテーブル、およびSP、PFC、DFC上のフォワーディング テーブルが同期化されました。

NSFのグレースフル リスタート ルーティング プロトコル拡張機能は、IETFドラフトとRFCに準拠しています。NSFプロトコル固有の詳細については、「参考資料」を参照してください。

MMLS NSF/SSO
Cisco IOSソフトウェア リリース12.2(18)SXD以前は、IPv4マルチキャストのスイッチオーバー モデルはRPR+でした。SRM/SSOがIPv4ユニキャストで設定されていても、PFC3ハードウェア内のマルチキャスト フォワーディング エントリはスタンバイ スーパーバイザ エンジンに同期化されません。

スイッチオーバーが発生すると、PFC3およびDFC3(存在する場合)上のマルチキャスト フォワーディング エントリは消去され、マルチキャスト トラフィックのサービスが中断されます。新しいアクティブRPがオンラインになったあとで、そのRPでPFC3およびDFC3のフォワーディング エンジン内のハードウェア フォワーディング エントリへの再入力を行うには、Protocol Independent Multicast(PIM)のネイバ関係を確立し、Internet Group Management Protocol(IGMP)パケットを処理するか、またはマルチキャスト状態の再コンバージェンスを行う必要があります。

MMLS NSF/SSOによって、システムはスーパーバイザ エンジンのスイッチオーバー中にPFC3およびDFC3ハードウェア内のマルチキャスト フォワーディングの状態を維持できるので、マルチキャスト サービスの中断を最小限に抑えることができます。

準備完了の状態にあるアクティブ スーパーバイザ エンジンは、スタンバイ スーパーバイザ エンジンをハードウェアのマルチキャスト フォワーディング エントリで同期化します。スーパーバイザ エンジンのスイッチオーバーが発生しても、PFC3およびDFC3のハードウェア フォワーディング テーブルは保持され、システムはマルチキャスト フォワーディング テーブルの有効な最新コピーを使用して、マルチキャスト トラフィックの転送を継続します。

新しいアクティブRPがオンラインになり、ネットワークでコンバージェンスが行われ、マルチキャスト転送の状態が再取得されると、そのRPによってPFC3およびDFC3上のハードウェア フォワーディング テーブルに新しい情報が再入力されます。

SSOとNSF/SSOの機能

表2~5は、SSOとNSF/SSO用に同期化されるレイヤ2、レイヤ3、WAN、およびハードウェアの機能を説明しています。「共存」として指定される機能はSSOおよびNSF/SSOと併用することが可能ですが、そのプロトコルの状態はアクティブ スーパーバイザからスタンバイ スーパーバイザには同期化されず、スイッチオーバーが発生した時点で再初期化されます。リリースの詳細は、Cisco Catalyst 6500のリリース ノートに記載されています。

レイヤ2機能の同期化
表2は、レイヤ2 SSO用に同期化されるレイヤ2プロトコルについて説明しています。記載されている機能は、Cisco IOSソフトウェア リリース12.2(17b)SXAを搭載したSupervisor Engine 720、およびCisco IOSソフトウェア リリース12.2(18)SXDを搭載したSupervisor Engine 2で使用できます。

表2 レイヤ2 SSOでサポートされている機能

レイヤ2 SSOでサポートされている機能
Cisco Discovery Protocol(CDP)(電力関連の情報についてのみステートフル) ポート セキュリティ
診断 Switched Port Analyzer(SPAN;スイッチド ポート アナライザ)とRemote SPAN(RSPAN)
802.1q STP
802.1X トラフィック ストーム
Dynamic Trunking Protocol(DTP;ダイナミック トランキング プロトコル) UDLD
IGMPスヌーピング VLANトランク
インターフェイスとポート ステート VLAN Trunking Protocol(VTP;VLANトランキング プロトコル)
レイヤ2プロトコル トンネリング 音声VLANとインライン パワー
ポート チャネリング:Port Aggregation Protocol(PAgP;ポート集約プロトコル)とLink Aggregation Control Protocol(LACP)  


レイヤ3機能の同期化
表3は、SRM/SSOおよびNSF/SSO用に同期化されるレイヤ3プロトコルについて説明しています。Enhanced Interior Gateway Routing Protocol(EIGRP)、Open Shortest Path First(OSPF)、IS-IS、およびBorder Gateway Protocol(BGP)用のNSF機能は、Cisco IOSソフトウェア リリース12.2(18)SXDを搭載したSupervisor Engine 720とSupervisor Engine 2で使用できます。Cisco IOSソフトウェア リリース12.2(18)SXDで導入されているMMLS NSF/SSOは、Supervisor Engine 720でのみ使用できます。

表3 レイヤ3機能の同期化

レイヤ3情報の同期化
NSF/SSOでサポートされている機能 SRM/SSOでサポートされている機能 共存機能
ARP ARP HSRP、GLBP、およびVirtual Router Redundancy Protocol(VRRP)
BGP ハードウェアのCEFテーブル Multiprotocol Label Switching(MPLS;マルチプロトコル ラベル スイッチング)、Internetwork Packet Exchange(IPX)、およびIPv6
CEFテーブル(ソフトウェアおよびハードウェア)   PIMスヌーピング
EIGRP   Routing Information Protocol(RIP)
IS-IS    
MMLS NSF/SSO    
OSPFv2    
VRF Lite    


WAN機能の同期化
表4は、SSO用に同期化されるWANプロトコルについて説明しています。記載されている機能は、Cisco IOSソフトウェア リリース12.2(18)SXDで使用できます。

表4 WAN機能の同期化

レイヤ2 SSOでサポートされている機能
SSOでサポートされている機能 共存機能
Asynchronous Transfer Mode(ATM;非同期転送モード) Distributed Link Fragmentation and Interleaving over ATM(dLFIoATM)
dLFI over Frame Relay(dLFIoFR)
Automatic Protection Switching(APS;自動保護スイッチング) Multilink PPP(MLPPP)とMultilink Frame Relay(MFR)
フレーム リレー IPヘッダー圧縮
High-Level Data Link Control(HDLC;ハイレベル データリンク制御) MPLSとAny Transport over MPLS(AToM)
PPP(ポイントツーポイント プロトコル) WANカード用QoS
Spatial Reuse Protocol(SRP)  
ATM dLFIoATM
dLFIoFR
APS MLPPPとMFR


ハードウェアのレイヤ2~4機能の同期化
表5は、SSOスイッチオーバーの発生時にスタンバイ スーパーバイザで利用できるPFC情報について説明しています。記載されている機能の大部分は、Cisco IOSソフトウェア リリース12.2(17b)SXAを搭載したSupervisor Engine 720、およびCisco IOSソフトウェア リリース12.2(18)SXDを搭載したSupervisor Engine 2で使用できます。

表5 ハードウェアのレイヤ2~4機能の同期化

ハードウェアのL2~4機能の同期化
ハードウェアのACLベースの機能 ハードウェアのFIB
ハードウェアの隣接テーブル ハードウェアのMACアドレス テーブル
ハードウェアのIPマルチキャスト情報 ハードウェアのQoSベースの機能


スイッチオーバーのパフォーマンス

NSF/SSOのフェールオーバー時間
図5は、NSF/SSOのパフォーマンス テスト用のセットアップを図示したものです。

図5 NSF/SSOのパフォーマンス テスト

図5のようなネットワーク構成で、Cisco Catalyst 6500でのNSF/SSOのパフォーマンスを測定しました。このセットアップには、各種動作モードに対応するフェールオーバー時間を記録するためのシミュレーション デバイスが組み込まれています。また、実際に使用されるアプリケーションがNSF/SSOスイッチオーバーによって影響を受けないかどうかを確認するため、アプリケーションのトラフィックも流れています。テストしたアプリケーションは映像およびVoIPアプリケーションなどです。

テスト用セットアップは、3台のCisco Catalyst 6500スイッチで構成されます。このセットアップの全スーパーバイザには、Cisco IOS 12.2(18)SXDがロードされています。テスト用デバイスのCisco Catalyst 6500には、近接ルータからのレイヤ2およびレイヤ3トラフィックをスイッチングする冗長構成のSupervisor 720が搭載されています。この双方向トラフィックには、トラフィック シミュレータによって100,000 ppsで生成されるレイヤ2およびレイヤ3トラフィック、IP Phoneおよび映像クライアント⁄サーバから送信される音声および映像トラフィックが含まれます。テスト手順は、RPR+、SSO(NSF機能は無効)、およびNSF/SSOの各フェールオーバー メカニズムについて実行されるレイヤ2およびテスト3テストで構成されます。レイヤ3テスト ランは、OSPF、EIGRP、IS-IS、およびBGP用に挿入した1000のルートで実施されました。ネイバはすべてNSF認識機能を持っています。

フェールオーバー時間は、スイッチオーバー中に送信されたパケット数と受信されたパケット数を比較することによって算出されます。パケット レートが指定されている場合(テスト ランでは100,000 pps)、フェールオーバー時間は(送信パケット数 - 受信パケット数)/パケット レートとなります。

表6は、トラフィックがWS-X6748-GE-TXモジュールの2つのポート間を伝送されているときのフェールオーバー時間を、各種のシナリオに基づいて示したものです。全体として、NSF/SSOではフェールオーバー時間はテスト条件に応じて0~3秒の範囲になります。

表6 NSF/SSOのフェールオーバー時間

フェールオーバー時間 レイヤ2トラフィック EIGRPでルーティングされるレイヤ3トラフィック OSPFでルーティングされるレイヤ3トラフィック IS-ISでルーティングされるレイヤ3トラフィック(シスコ方式) IS-ISでルーティングされるレイヤ3トラフィック(IETF方式) BGPでルーティングされるレイヤ3トラフィック
RPR+ 62.00秒 70.00秒 140.00秒 82.00秒 82.00秒 130.00秒
SSO(NSF機能は無効) 0.50秒 6.00秒 11.00秒 0.55秒 0.55秒 54.00秒
NSF/SSO 0.50秒 0.55秒 0.55秒 0.55秒 0.55秒 0.55秒


Cisco Catalyst OSとCisco IOSソフトウェアのハイ アベイラビリティの比較
表7は、Cisco Catalyst OS、ハイブリッド、およびCisco IOSソフトウェアのスイッチオーバーのパフォーマンス値を、同等の機能について比較したものです。Cisco Catalyst OSのスーパーバイザの冗長メカニズムの詳細については、次のURLを参照してください。
http://www.cisco.com/warp/public/cc/pd/si/casi/ca6000/tech/hafc6_wp.pdf

Cisco Catalyst OSの高速スイッチオーバー機能は、Cisco IOSソフトウェアのRPR+機能に相当します。Cisco Catalyst OSのハイ アベイラビリティ機能は、Cisco IOSソフトウェアのSSO機能に相当します。両機能ともレイヤ2プロトコルの同期化とレイヤ2~4のハードウェア同期化を提供しています。

SRM冗長方式によるハイブリッドのハイ アベイラビリティは、SSOのハイブリッドに相当します。ハイブリッド モデルでは、NSF機能はサポートされていません。

表7は、Cisco Catalyst OS、ハイブリッド、およびCisco IOSソフトウェアの冗長機能のパフォーマンス値を比較したものです。

表7 Cisco Catalyst OSとCisco IOSソフトウェアのスーパーバイザの冗長機能

Cisco Catalyst OS ハイブリッド Cisco IOSソフトウェア
- - RPR:> 120.00秒
高速スイッチオーバー:> 30.00秒 高速スイッチオーバー:> 30.00秒 RPR+:30.00秒
ハイ アベイラビリティ:0.50~5.00秒 SRMでのハイ アベイラビリティ:0.50~5.00秒 SSO:0.00~3.00秒
ハイ アベイラビリティ:0.50~5.00秒 SRMでのハイ アベイラビリティ:0.50~5.00秒 NSF/SSO:0.00~3.00秒
ハイ アベイラビリティ バージョニング ハイ アベイラビリティ バージョニング FSU


統計情報とSNMP

統計情報
アクティブ スーパーバイザで保持されている各種の統計情報は、スタンバイ スーパーバイザには同期化されません。統計情報は頻繁に変化するため、相当な規模の同期が必要となるからです。影響を受ける統計情報を定期的にポーリングして正確さを維持するには、ネットワーク管理システムを使用する必要があります。

SNMP
SNMP(簡易ネットワーク管理プロトコル)のデータは、スーパーバイザがSSOモードで動作しているときは冗長化したスーパーバイザ間で同期化されます。これは、スタンバイ スーパーバイザとアクティブ スーパーバイザがネットワーク管理システムから見て区別できないことを保証するためです。同期化されるSNMPオブジェクトには、ifindexなどのインターフェイス関連の機能やSNMP設定などがあります。

Cisco High-Availability MIBであるCISCO-RF_MIBは、冗長情報を管理者にレポートします。この情報には、プライマリ スーパーバイザとセカンダリ スーパーバイザのID、現在の冗長性の状態、および最新のスイッチオーバーの発生原因と発生時間が含まれます。スイッチオーバーが発生すると、ciscoRFSwactNotif通知によってスイッチオーバーの信号が送られます。

Cisco-RF MIBが使用されるほか、SyslogメッセージとSNMPトラップが送信され、管理者にコンポーネントの障害が通知されます。

SNMPデータの同期化は、RPRおよびRPR+動作モードでは利用できません。

SSOのSNMPサポートの詳細については、次のURLを参照してください。(英語)
http://www.cisco.com/univercd/cc/td/doc/product/software/ios120/120newft/120limit/120s/120s26/ssomibs3.htm

サービス モジュールでのスーパーバイザのSSO機能のサポート

NSF/SSOによるスーパーバイザのフェールオーバー イベントの間、サービス モジュールの動作が継続されるのは重要なことです。現在のサービス モジュールの多くは特定のハイ アベイラビリティ メカニズムを備えており、シャーシ内またはシャーシ間でモジュール間のスイッチオーバーを実行できます。サービス モジュールでのスーパーバイザのNSF/SSOのサポートは、スーパーバイザのフェールオーバーの影響を最小限に抑えることによって、各サービス モジュールのハイ アベイラビリティ メカニズムを補完します。

標準のスイッチング モジュールのSSOに関連する各特性は、サービス モジュールにも当てはまります。サービス モジュールは再起動せず、そのインターフェイスは動作を継続します。また、サービス モジュールはライン カードが同期化される短い時間を除いて、スーパーバイザのスイッチオーバーの影響を受けません。

サービス モジュールのSSOモード互換性については、次のリリース ノートで確認してください。(英語)
http://www.cisco.com/univercd/cc/td/doc/product/lan/cat6000/122sx/ol_4164.htm

WANモジュールでのスーパーバイザのSSOのサポート

OSM(オプティカル サービス モジュール)とFlexWANモジュールはスタンバイ スーパーバイザ エンジンでサポートされており、NSF/SSOによるスーパーバイザのフェールオーバー イベントの間も動作を継続します。

参考資料

ハイ アベイラビリティ:
ハイ アベイラビリティに関する技術文書:
http://www.cisco.com/warp/public/732/Tech/grip/splash/

Cisco Catalyst 6500のハイ アベイラビリティ:
Cisco Catalyst 6500シリーズ スイッチのハイ アベイラビリティ(Catalyst OSのハイ アベイラビリティ):
http://www.cisco.com/warp/public/cc/pd/si/casi/ca6000/tech/hafc6_wp.pdf

スーパーバイザ エンジンの冗長性の設定:
http://www.cisco.com/jp/service/manual_j/sw/cat60/iosscg/chapter07/07_redund.shtml

NSF/SSOを使用したスーパーバイザ エンジンの冗長性の設定:
http://www.cisco.com/univercd/cc/td/doc/product/lan/cat6000/122sx/swcg/nsfsso.htm

Cisco IOSソフトウェア リリース12.2SXのリリース ノート(英語):
http://www.cisco.com/univercd/cc/td/doc/product/lan/cat6000/122sx/ol_4164.htm

Cisco Catalyst 6500シリーズ スイッチのマニュアル:
http://www.cisco.com/jp/service/manual_j/index_sw_cat6500.shtml

ステートフル スイッチオーバー(英語):
SNMP SSO:
http://www.cisco.com/univercd/cc/td/doc/product/software/ios120/120newft/120limit/120s/120s26/ssomibs3.htm

NSF/SSO:
NSF:
http://www.cisco.com/univercd/cc/td/doc/product/software/ios122s/122snwft/release/122s20/fsnsf20s.htm

IETFのルーティング プロトコル拡張機能(英語):
http://www.ietf.org/