SSO の制約事項
• 「一般的な制約事項」
• 「コンフィギュレーション モードに関する制約事項」
• 「スイッチオーバー プロセスに関する制約事項」
一般的な制約事項
• 2 つの RP をシャーシに設置し、それぞれが同じバージョンの Cisco IOS ソフトウェアを実行している必要があります。
• 両方の RP は、同じ Cisco IOS イメージを実行する必要があります。2 つの RP が、異なる Cisco IOS イメージを実行している場合、SSO が設定されていても、システムは RPR モードに戻ります。
• SNMP 経由で行った設定変更が、スイッチオーバーの実行後、自動的にスタンバイ RP に設定されないことがあります。
• デュアル プロセッサ間のロード シェアリングはサポートされていません。
• ホット スタンバイ ルーティング プロトコル(HSRP)は、Cisco NSF/SSO でサポートされていません。HSRP を Cisco NSF/SSO で使用しないでください。
• 拡張オブジェクト トラッキング(EOT)は、SSO 認識ではないので、SSO モードで HSRP 仮想ルータ冗長プロトコル(VRRP)、ゲートウェイ ロード バランシング プロトコル(GLBP)とともには使用できません。
• マルチキャストは SSO を認識しないため、スイッチオーバー後に再起動されません。したがって、マルチキャスト テーブルおよびデータ構造は、スイッチオーバー時にクリアされます。
コンフィギュレーション モードに関する制約事項
• 両方の RP のコンフィギュレーション レジスタを同一に設定する必要があります。これにより、いずれか一方の RP がリブートされても、ネットワーキング デバイスの動作が同一に維持されます。
• 起動時の(一括)同期の際、設定の変更はできません。設定を変更する場合は、次のような内容のメッセージが表示するまで待ってください。
%HA-5-MODE:Operating mode is sso, configured mode is sso.
スイッチオーバー プロセスに関する制約事項
• ファブリックのコンフィギュレーションに対する変更と RP スイッチオーバーが同時に発生した場合、シャーシおよびすべてのラインカードがリセットされます。
• スイッチが SSO モードに設定されていて、スタンバイの準備が完了する前にアクティブ RP に障害が発生した場合、スイッチはフル システム リセットによって回復します。
• アクティブ RP とスタンバイ RP の間での SSO の同期中は、設定されたモードは RPR になります。同期が完了すると、動作モードが SSO になります。同期が完了する前にスイッチオーバーが発生すると、スイッチオーバーが RPR モードになります。
• 一括同期処理が完了する前にスイッチオーバーが発生した場合、新しくアクティブになった RP が不整合な状態になることがあります。この場合、スイッチが再度読み込まれます。
• SSO モードでスイッチオーバーが実行されても、ラインカードはリセットされません。
• RP 自体のインターフェイスはステートフルではなく、スイッチオーバーごとにリセットされます。特に、RP 上の GE インターフェイスは、スイッチ オーバーごとにリセットされ、SSO をサポートしません。
• スイッチオーバーの時点でオンラインでないすべてのラインカードは、リセットされ、スイッチオーバー時にリロードされます。
SSO について
• 「SSO の概要」
• 「SSO の動作」
• 「ルート プロセッサの同期」
• 「SSO の動作」
• 「SSO 認識機能」
SSO の概要
Catalyst 6500 シリーズ スイッチでは、プライマリのスーパーバイザ エンジンに障害が発生した場合、冗長スーパーバイザ エンジンに切り替えることができることで、障害に対する耐久性が提供されています。シスコ SSO(一般に NSF と使用)は、スイッチオーバー後、IP パケットの転送を継続する一方で、ユーザのネットワーク使用不能時間を最小限に抑えます。Catalyst 6500 シリーズ スイッチは、冗長性のため、Route Processor Redundancy(RPR)をサポートします。詳細については、「Route Processor Redundancy(RPR)」 を参照してください。
SSO は特にネットワーク エッジで役立ちます。従来から、コア ルータはルータの冗長化とメッシュ接続を使用して、障害ネットワーク要素を迂回したトラフィック伝送を可能にすることにより、ネットワーク障害からシステムを保護します。SSO は、ネットワーク設計内のシングル ポイント障害であり、障害時には顧客に対するサービス提供が中断する可能性があるネットワーク エッジ デバイスを、デュアル ルート プロセッサ(RP)によって保護します。
SSO には次のような多くの利点があります。SSO 機能は、ステートフル機能情報を保守するため、ユーザ セッション情報は、スイッチオーバー中に保守され、ラインカードは、引き続き、セッションを損失することなくネットワーク トラフィックを転送します。これにより、ネットワーク アベイラビリティが改善されます。また SSO では、RPR よりもスイッチオーバーが高速で実行されます。これは 1 つにはスタンバイ RP を完全に初期化して完全に設定するからであり、もう 1 つには、ステート情報を同期することによってルーティング プロトコルのコンバージェンスに要する時間を短縮できるからです。ネットワークの安定性は、ネットワーク内でルータに障害が発生し、ルーティング テーブルが失われたときに作成されるルート フラップの数を減らすことで改善できます。
Cisco Nonstop Forwarding(NSF)機能には SSO が必要です(を参照)。
図 7-1 は、サービス プロバイダー ネットワークに SSO が展開される一般的な方法を示します。この例では、CiscoNSF/SSO が主にサービス プロバイダー ネットワークのアクセス レイヤ(エッジ)に配置されています。このポイントで障害が発生すると、サービス プロバイダー ネットワークへのアクセスが必要なエンタープライズ カスタマーのサービスを損なう可能性があります。
Cisco NSF プロトコルは、ネイバー デバイスが Cisco NSF に参加している必要があるので、それらのネイバー ディストリビューション レイヤ デバイスに Cisco NSF 対応のソフトウェア イメージをインストールする必要があります。その他に、ネットワークのコア レイヤに Cisco NSF と SSO 機能を適用することで、ネットワーク アベイラビリティの利点が得られる可能性もありますが、ネットワーク設計エンジニアと相談して、具体的なサイトの要件を評価してください。
図 7-1 Cisco NSF/SSO ネットワーク構成:サービス プロバイダー ネットワーク
アベイラビリティの向上は、シングル ポイント障害が存在するネットワーク内の他のポイントに Cisco NSF/SSO を展開することによって得られます。図 7-2 は、エンタープライズ ネットワーク アクセス レイヤに Cisco NSF/SSO を適用するもう 1 つの展開方法を示します。この例では、エンタープライズ ネットワーク内の各アクセス ポイントが、ネットワーク設計内の他のシングル ポイント障害を表します。スイッチオーバーまたは計画されたソフトウェア アップグレードが行われても、企業顧客のセッションは中断することなくネットワーク内で稼働し続けます。
図 7-2 Cisco NSF/SSO ネットワーク構成:エンタープライズ ネットワーク
SSO の動作
SSO は RP の 1 つをアクティブ プロセッサ、もう一方の RP をスタンバイ プロセッサとして設定します。SSO は完全にスタンバイ RP を初期化し、アクティブ RP とスタンバイ RP 間で重要なステート情報を同期します。
SSO スイッチオーバー時に、ラインカードではリセットされません。これにより、プロセッサ間のスイッチオーバーが高速化されます。次のイベントが発生すると、スイッチオーバーが行われます。
• アクティブ スーパーバイザ エンジンでのハードウェア障害
• スーパーバイザ エンジン間のクロック同期損失
• 手動スイッチオーバーまたはシャットダウン
SSO スイッチオーバーでは、レイヤ 2 トラフィックは中断されません。SSO スイッチオーバーは FIB と隣接エントリを保護し、スイッチオーバーの後にレイヤ 3 トラフィックを転送できます。SSO スイッチオーバー時間は 0 ~ 3 秒です。
同期化の概要
SSO が動作するネットワーキング デバイスでは、アクティブ RP に障害が発生したときに、スタンバイ RP がいつでも制御を引き継げるように、両方の RP で同じコンフィギュレーションを実行する必要があります。起動時およびアクティブ RP のコンフィギュレーションに変更が生じるたびに、SSO はアクティブ RP からスタンバイ RP にコンフィギュレーション情報を同期します。この同期は、次の 2 段階で行われます。
• スタンバイ RP の起動時に、アクティブ RP からスタンバイ RP にコンフィギュレーション情報が同期されます。
• コンフィギュレーションまたはステートに変更が生じたときに、アクティブ RP からスタンバイ RP へのインクリメンタル同期が実行されます。
初期化時の一括同期
SSO を備えたシステムの初期化時に、アクティブ RP はシャーシ探索(システムにあるラインカードの数とタイプ、およびファブリック カードが装着されている場合は、その数とタイプ)を実行し、スタートアップ コンフィギュレーション ファイルを解析します。
アクティブ RP は次に、このデータをスタンバイ RP に同期し、スタンバイ RP に対して初期化を完了するように指示します。この方法により、両方の RP に同じコンフィギュレーション情報が設定されます。
スタンバイ RP は、完全に初期化されていても、アクティブ RP とのみやり取りし、コンフィギュレーション ファイルに変更が生じたときにその増分を受け取ります。スタンバイ RP に対する CLI の実行はサポートされていません。
スタートアップ コンフィギュレーションの同期
システムの起動時に、スタートアップ コンフィギュレーション ファイルがアクティブ RP からスタンバイ RP にコピーされます。スタンバイ RP にある既存のスタートアップ コンフィギュレーション ファイルは上書きされます。
スタートアップ コンフィギュレーションは、RP の NVRAM に保存されたテキスト ファイルです。このファイルは、次の操作を実行するたびに同期されます。
• CLI コマンド copy system:running-config nvram:startup-config を使用したとき
• CLI コマンド copy running-config startup-config を使用したとき
• CLI コマンド write memory を使用したとき
• CLI コマンド copy filename nvram:startup-config を使用したとき
• CISCO_CONFIG_COPY MIB で、MIB 変数 ccCopyEntry の SNMP SET を使用したとき
• reload コマンドを使用してシステム コンフィギュレーションを保存したとき
• 強制スイッチオーバー CLI コマンドの入力後に、ステム コンフィギュレーションを保存したとき
インクリメンタル同期の概要
両方の RP が完全に初期化された後、実行コンフィギュレーションまたはアクティブ RP ステートに対して行われた変更は、発生したときにスタンバイ RP に同期されます。アクティブ RP ステートは、機能情報処理、外部イベント(インターフェイスがアップ状態またはダウン状態になるなど)、またはユーザ コンフィギュレーション コマンド(CLI コマンドや簡易ネットワーク管理プロトコル(SNMP)を使用)やその他の内部イベントの結果として更新されます。
CLI コマンド
CLI による実行コンフィギュレーションの変更は、アクティブ RP からスタンバイ RP に同期されます。実際には、CLI コマンドがアクティブとスタンバイの両方の RP に対して実行されます。
SNMP SET コマンド
SNMP set 操作によるコンフィギュレーション変更は、ケースバイケースで同期されます。現在、次の 2 つの SNMP コンフィギュレーション設定操作のみがサポートされています。
• (インターフェイスの) shut および no-shut
• link up/down trap enable/disable
情報のルーティングおよび転送
情報のルーティングおよび転送は、RP に同期されます。
• SSO 認識機能(SNMP など)のステート変更は、スタンバイ RP へ同期されます。
• シスコ エクスプレス フォワーディングによる転送情報ベース(FIB)の更新は、スタンバイ RP に同期されます。
シャーシのステート
ラインカードの抜き挿しによるシャーシ ステートの変更は、スタンバイ RP に同期されます。
ラインカードのステート
ラインカードのステートの変更は、スタンバイ RP に同期されます。ラインカードのステート情報は、最初、スタンバイ RP の一括同期によって取得されます。一括同期の後、アクティブ プロセッサで受信されたラインカード イベント(インターフェイスのアップ/ダウン状態など)は、スタンバイ RP に同期されます。
カウンタおよび統計情報
アクティブ RP で維持されているさまざまなカウンタおよび統計情報は、頻繁に変更されるうえ、必要とされる同期の程度が大きいため同期されません。統計情報に関連付けられている情報量が非常に大きいため、同期は実際的ではありません。
(注) RP 間でカウンタと統計情報が同期されないために、この情報をモニタする外部ネットワーク管理システムで問題が生じることがあります。
SSO 条件
自動または手動スイッチオーバーは、次の条件で実行される可能性があります。
• アクティブ RP のクラッシュまたはリブートを引き起こす原因となる障害状態:自動スイッチオーバー
• アクティブ RP の機能停止が宣言された場合(応答なし):自動スイッチオーバー
• CLI が呼び出された場合:手動スイッチオーバー
ユーザは CLI コマンドを使用して、アクティブ RP からスタンバイ RP へのスイッチオーバーを強制できます。この手動の手順により、アクティブな RP の「通常の」制御されたシャットダウンが行われ、スタンバイ RP に切り替えられます。この通常シャットダウンにより、不可欠なクリーンアップが行われます。
(注) この手順を、コア ルータのルーティング プロトコルについてのグレースフル シャットダウン手順と混同しないでください。これらは別個のメカニズムです。
注意 SSO 機能では、手動でスイッチオーバーを実行するコマンドなど、いくつかの新しいコマンドが導入されるとともに、既存のコマンドが変更されています。
reload コマンドでは、スイッチオーバーは発生しません。
reload コマンドを実行すると、ボックスが完全にリロードされ、すべてのテーブル エントリが削除され、すべてのラインカードがリセットされて、ノンストップ フォワーディングが中断されます。
スイッチオーバー時間
アクティブ RP からスタンバイ RP に切り替えるためにデバイスに必要な時間は、0 ~ 3 秒です。
新しくアクティブになったプロセッサは、スイッチオーバーの直後に処理を引き継ぎますが、デバイスが完全冗長(SSO)モードで動作を再開するまでには、プラットフォームによっては、数分かかることもあります。スイッチオーバー時間の長さは、複数の要因に左右されます。たとえば、前にアクティブだったプロセッサがクラッシュ情報を取得する時間、コードおよびマイクロコードをロードする時間、およびプロセッサ間のコンフィギュレーションの同期に必要な時間などが要因として挙げられます。
DFC 搭載のスイッチング モジュールでは、転送情報が配信され、同じラインカードから転送されるパケットは、転送遅延がほとんどありません。ただし、ラインカード間でパケットを転送すると、スイッチオーバー時間の間、パケット転送が待機する必要がある可能性があるため、RP との対話が必要です。
アクティブ RP の活性挿抜
アクティブ RP の活性挿抜は、スタンバイ RP へのステートフル スイッチオーバーを自動的に強制します。
高速ソフトウェア アップグレード
Fast Software Upgrade(FSU)を使用して、予定されているダウンタイムを短縮することができます。FSU を使用すると、アップグレードされた Cisco IOS ソフトウェア イメージがあらかじめロードされたスタンバイ RP にシステムをスイッチオーバーできます。FSU は、アップグレードされた Cisco IOS ソフトウェアがあらかじめインストールされているスタンバイ RP に機能を転送することにより、ソフトウェア アップグレード時のダウンタイムを短縮します。また、古いバージョンの Cisco OS にシステムをダウングレードしたり、アップグレードの直後に、前のイメージにダウングレードするためにバックアップ システムをロードしたりするためにも FSU を使用できます。
FSU を実行する前に、ネットワーキング デバイスで SSO を設定する必要があります。
(注) アップグレード プロセスでは、さまざまなイメージが、短時間だけ RP にロードされます。この間、デバイスは RPR モードで動作します。
コア ダンプ処理
SSO をサポートするネットワーキング デバイスでは、スイッチオーバーが行われた後、新しくアクティブになったプライマリ プロセッサが、コア ダンプ処理を実行します。ダンプ処理を待つ必要がないので、プロセッサ間のスイッチオーバー時間が効果的に短縮されます。
スイッチオーバーの後、新しいアクティブ RP は、コア ダンプが完了するまで一定時間待った後、以前のアクティブ RP のリロードを試みます。この待ち時間は設定可能です。たとえば、プラットフォームによっては、以前のアクティブ RP がコア ダンプを実行するのに 1 時間またはそれ以上必要なことがありますが、サイト ポリシーによっては、それほど長い時間待機せずに、以前のアクティブ RP のリセットとリロードを行うことがあります。指定された時間内にコア ダンプが完了しない場合、コア ダンプがまだ実行中であるかどうかとは無関係に、スタンバイがリセットされてリロードされます。
コア ダンプ プロセスは、ファイルの内容を生成したプロセッサを識別するためのスロット番号をコア ダンプ ファイルに追加します。
(注) コア ダンプは、一般的にテクニカルサポート担当者にだけ役立ちます。コア ダンプ ファイルは、非常に大きなバイナリ ファイルであり、TFTP、FTP、またはリモート コピー プロトコル(RCP)サーバを使用して転送した後、ソース コードと詳細なメモリ マップにアクセスできる Cisco Technical Assistance Center(TAC)の担当者に分析してもらう必要があります。
SSO 認識機能
機能が、RP スイッチオーバーを経ても、一部または全体が問題なく動作し続ける場合、その機能やプロトコルは SSO 認識です。SSO 認識機能のステート情報は、これらの機能のステートフル スイッチオーバーを実現するために、アクティブからスタンバイへ同期されます。
SSO 非認識の機能の場合、ステートをダイナミックに作成しても、スイッチオーバー時に失われるため、スイッチオーバーの際に再初期化と再起動が必要になります。
show redundancy clients コマンドの出力には、SSO 認識機能が表示されます(「SSO 機能の確認」を参照)。
SSO のトラブルシューティング
• 「考えられる SSO の問題状況」
• 「SSO のトラブルシューティング」
考えられる SSO の問題状況
• スタンバイ RP をリセットしたが、生じた問題を説明するメッセージが表示されない:SSO イベントのログなど、スイッチオーバーやその他のイベントが発生した理由を探る鍵となるものを表示するには、新しくアクティブになった RP で show redundancy history コマンドを実行します。
Router# show redundancy history
• show redundancy states コマンドを実行すると、ネットワーキング デバイスでの設定内容と異なる動作モードが表示される:特定のプラットフォームで show redundancy states コマンドを使用すると、プラットフォームごとに設定されたコンフィギュレーション モードではなく、デバイスで実行されている実際の動作冗長モードが出力表示されることがあります。システムの動作モードは、システム イベントに応じて変化する可能性があります。たとえば、SSO を使用するためには、ネットワーキング デバイス上の両方の RP が同じソフトウェア イメージを実行する必要があります。イメージが異なる場合、デバイスはそのコンフィギュレーションに関係なく、SSO モードでは動作しなくなります。
たとえば、アップグレード プロセス中にごく短時間、さまざまなイメージが RP にロードされます。この間にスイッチオーバーが発生すると、デバイスは RPR モードで回復します。
• デバイスをリロードすると、SSO の動作が中断する:SSO の機能によって新しいコマンドが導入されましたが、その中に、手動でスイッチオーバーを発生させるコマンドがあります。reload コマンドは SSO コマンドではありません。このコマンドを実行すると、ボックスが完全にリロードされ、すべてのテーブル エントリが削除され、すべてのラインカードがリセットされるので、ネットワーク トラフィック転送が中断されます。誤ってボックスをリロードしないようにするには、 redundancy force-switchover コマンドを使用します。
• ソフトウェア アップグレードの際、ネットワーキング デバイスが SSO ではないモードで表示される:ソフトウェア アップグレード プロセス中は、show redundancy コマンドを使用するとデバイスが SSO ではないモードで動作していることを示します。
これは正常な動作です。FSU 手順が完了するまで、各 RP では異なるソフトウェア バージョンが実行されています。RP が異なるソフトウェア バージョンを実行している間、モードはいずれかの RPR に変更されます。アップグレードが完了すれば、デバイスは SSO モードに変更されます。
• コア ダンプが完了する前に以前のアクティブ プロセッサのリセットとリロードが実行される:以前のアクティブ プロセッサのリセットとリロードを実行するまでの新しいアクティブ プロセッサの最大待機時間を設定するには、 crashdump-timeout コマンドを使用します。
• 「send break」コマンドを発行してもシステムのスイッチオーバーが実行されない:これは通常の動作です。「send break」コマンドを使用して、システムをブレークまたは一時停止することは推奨できません。予期しない結果が生じるおそれがあります。手動のスイッチオーバーを開始するには、 redundancy force-switchover コマンドを使用します。
Cisco IOS ソフトウェアでは、スイッチを再起動し、起動開始から 60 秒以内に Break キーを押すか Telnet セッションから「send break」コマンドを実行すると、ROM モニタ モードを開始できます。send break 機能は、経験豊富なユーザまたは Cisco Technical Assistance Center(TAC)の担当者の指示によって操作しているユーザが、特定のシステム障害の回復やシステム障害の原因の解明を行うのに役立ちます。
SSO のトラブルシューティング
次の各コマンドは、必要に応じて SSO 機能のトラブルシューティングに使用できます。これらのコマンドには、決まった入力順序はありません。
|
|
Router(config-red)# crashdump-timeout [ mm | hh : mm ] |
新しいアクティブ RP が、それまでアクティブだった RP をリロードするまでに待つ最長時間を設定します。 |
Router# debug redundancy { all | ui | clk | hub } |
ネットワーキング デバイスで、冗長をデバッグします。 |
Router# show diag [ slot-number | chassis | subslot slot / subslot ] [ details | summary ] |
ハードウェア情報を表示します。 |
Router# show redundancy [ clients | counters | debug-log | handover | history | switchover history | states | inter-device ] |
RP の冗長コンフィギュレーション モードを表示します。スイッチオーバーの回数、システム稼働時間、プロセッサ稼働時間、冗長ステート、およびスイッチオーバーの理由に関する情報もあわせて表示します。 |
Router# show version |
各 RP に関するイメージ情報を表示します。 |