Cisco ASR 9000 シリーズ アグリゲーション サービス ルータ 概要およびリファレンス ガイド
ハイ アベイラビリティおよび冗長運用
ハイ アベイラビリティおよび冗長運用
発行日;2012/01/10 | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 6MB) | フィードバック

目次

ハイ アベイラビリティおよび冗長運用

機能の概要

ハイ アベイラビリティ ルータの運用

ステートフル スイッチオーバー

ファブリック フェールオーバー

アクティブ/スタンバイのステータスの解釈

ノンストップ フォワーディング

ノンストップ ルーティング

グレースフル リスタート

プロセスの再開性

障害の検出および管理

電源の冗長性

AC 電源の冗長性

DC 電源の冗長性

電源問題の検出および報告

冷却システムの冗長性

冷却障害のアラーム

ハイ アベイラビリティおよび冗長運用

この章では、Cisco ASR 9000 シリーズ Aggregation Services Routersのハイ アベイラビリティおよび冗長性について説明します。

機能の概要

Cisco ASR 9000 シリーズ ルータは、高い Mean Time Between Failure(MTBF; 平均故障間隔)レートおよび低い Mean Time To Resolve(MTTR; 平均解決時間)レートを実現するように設計されており、停止やダウンタイムを最小限に抑え、最大限のアベイラビリティを確保する信頼性のあるプラットフォームを提供しています。

また、Cisco ASR 9000 シリーズは、ネットワーク レベルの復元力を強化し、ネットワーク全体の保護を可能にするために、次の High Availability(HA; ハイ アベイラビリティ)機能を提供しています。

ハイ アベイラビリティ ルータの運用

ステートフル スイッチオーバー

ファブリック フェールオーバー

ノンストップ フォワーディング

プロセスの再開性

障害の検出および管理

電源の冗長性

冷却システムの冗長性

ハイ アベイラビリティ ルータの運用

Cisco ASR 9000 シリーズは、ハードウェアおよびソフトウェアのさまざまなハイ アベイラビリティ機能を提供しています。

ステートフル スイッチオーバー

Route Switch Processor(RSP; ルート スイッチ プロセッサ)カードが「アクティブ/スタンバイ」構成で展開されています。Stateful Switchover(SSO; ステートフル スイッチオーバー)によって、スイッチオーバー イベントのステート情報と構成情報がスタンバイ RSP カードに保存されます。スタンバイ RSP カードには、プロトコルのステート、ユーザ設定、インターフェイス ステート、加入者ステート、システム ステート、およびその他のパラメータのミラー イメージが含まれています。ハードウェアやソフトウェアの障害がアクティブ RSP カードで発生すると、スタンバイ RSP カードのステートが変更され、アクティブ RSP カードになります。このステートフル スイッチオーバーによる転送トラフィックへの影響はありません。

ファブリック フェールオーバー

ファブリックの大半は RSP カードで構成されています。ファブリックは、トラフィックの負荷を両方の RSP カードに分散できる、「アクティブ/アクティブ」コンフィギュレーション モデルで構成されています。障害が発生した場合は、1 つの「アクティブ」スイッチ ファブリックがシステムでのトラフィックの転送を続行します。

アクティブ/スタンバイのステータスの解釈

各 RSP カードのステータス信号を監視して、ステータスがアクティブ/スタンバイのいずれであるか、および RSP カード間でのスイッチオーバーが必要な障害が発生したかどうかが判別されます。

ノンストップ フォワーディング

Cisco IOS XR ソフトウェアでは、コントロール プレーンが短時間停止してもトラフィックを消失することなくパケットを転送できる、Non-Stop Forwarding(NSF; ノンストップ フォワーディング)がサポートされています。NSF は、Internet Engineering Task Force(IETF; インターネット技術特別調査委員会)で標準化された、グレースフル リスタート拡張用のシグナリング実装とルーティング プロトコル実装を使用して実装されています。

たとえば、特定のソフトウェア モジュールのソフト リブートによって、ネットワーク プロセッサ、スイッチ ファブリック、またはパケット転送の物理インターフェイス操作が妨害されることはありません。同様に、非データ パス デバイス(イーサネット アウトオブバンド チャネル ギガビット イーサネット スイッチなど)のソフト リセットの場合も、パケット転送に影響を与えません。

ノンストップ ルーティング

Nonstop Routing(NSR; ノンストップ ルーティング)を使用すると、プロセッサのスイッチオーバーが行われた後にルーティング プロトコル情報がリフレッシュされる間、既知のルートを使用してデータ パケットの転送を続行できます。NSR によって、MPLS VPN などのサービス用の SSO 機能全体でプロトコル セッションやステート情報が維持されます。TCP 接続およびルーティング プロトコル セッションは、RSP フェールオーバーがピアに通知されずに行われた後、アクティブ RSP カードからスタンバイ RSP カードに移行されます。スタンバイ RSP がアクティブになると、セッションが終了し、スタンバイ RSP カード上で実行されているプロトコルによってセッションが再確立されます。また、NSR をグレースフル リスタートで使用して、スイッチオーバー時にルーティング コントロール プレーンを保護することもできます。NSR の機能は、Open Shortest Path First Protocol(OSPF)および Label Distribution Protocol(LDP; ラベル配布プロトコル)のルーティング テクノロジーにだけ使用できます。

グレースフル リスタート

Graceful Restart(GR; グレースフル リスタート)によって、ノンストップ フォワーディング(NSF)サービスが維持されると同時に、障害状態の検出および回復を可能にするハイ アベイラビリティを確保するためにコントロール プレーン メカニズムが提供されています。グレースフル リスタートは、フォワーディング プレーンに影響を与えずに、シグナリングおよびコントロール プレーンの障害から回復する方法です。Cisco IOS XR ソフトウェアでは、グレースフル リスタートを使用し、チェック ポインティング、ミラーリング、ルート スイッチ プロセッサ冗長性、およびその他のシステム復元機能を組み合わせて使用することによって、タイムアウトの前の状態を回復し、ネットワークの再収束によるサービス ダウンタイムを回避します。

プロセスの再開性

Cisco IOS XR 分散およびモジュラ マイクロカーネル オペレーティング システムを使用して、プロセスの独立性、再開性、およびメモリ ステートや動作ステートのメンテナンスが可能になります。各プロセスは、保護されたアドレス レンジで実行されます。チェック ポインティング機能、および信頼性の高い転送機能と再送信機能を使用すると、トラフィックの中断を最小限に抑えるか、または中断なしで、他のコンポーネントに影響を与えずにプロセスをリスタートできます。プロセスは通常、失敗、異常終了、または何らかの障害が発生すると、自動的にリスタートします。たとえば、Border Gateway Protocol(BGP; ボーダー ゲートウェイ プロトコル)または Quality of Service(QoS; サービス品質)プロセスは、障害が発生した場合、他のプロセスに影響を与えずにリスタートして通常のルーチンを再開します。

障害の検出および管理

Cisco ASR 9000 シリーズでは、単一または複数のシステム コンポーネントに対して、またはネットワーク障害に対して迅速かつ効率的に対応することによって、サービスの停止を最小限に抑えています。ローカルな障害処理では深刻な障害から回復できない場合、システムによって、堅牢な障害検出、修正、フェールオーバー、およびイベント管理の機能が提供されます。

障害の検出および修正:ASR 9000 には、ハードウェアに Error Correction Code(ECC; エラー訂正コード)保護メモリが含まれています。メモリが破損すると、影響を受けたプロセスが自動的にリスタートされ、影響を最小限に抑えて問題が解決されます。問題が解決されない場合、ASR 9000 では、システム内の他のハードウェア コンポーネントのサービスに影響を与えずに欠陥のあるハードウェアを交換できるように、スイッチオーバー機能および Online Insertion and Removal(OIR; 活性挿抜)機能がサポートされています。

リソース管理:障害処理機能の一部として、ASR 9000 では、Out of Resource(OOR; リソース不足)管理を強化するために、CPU およびメモリ使用率に関するリソースしきい値モニタリングがサポートされています。しきい値の条件を満たすか、または超過した場合は、OOR アラームが生成され、オペレータに OOR 状態が通知されます。次に、自動回復が試行され、オペレータは組み込みのイベント マネージャを使用して柔軟なポリシーを設定できます。

オンライン診断:Cisco ASR 9000 シリーズは、ネットワーク パス障害の検出、パケット方向転換失敗の検出、欠陥のあるファブリック リンクの検出などの機能を監視するために、組み込みのオンライン診断を提供しています。これらのテストは、CLI を使用して設定できます。

イベント管理:Cisco ASR 9000 シリーズは、ラボ テストでハードウェア障害を検出するための障害注入テストなどのメカニズム、失敗したプロセスを回復するためのウォッチドッグ メカニズム、およびルーティング テーブルと転送テーブル間の不整合を診断するための Route Consistency Checker などのツールを提供しています。

電源の冗長性

Cisco ASR 9000 シリーズ ルータは、電源モジュールの障害およびその後の交換で大幅な停止が発生しないように構成されています。

電源の障害、または電源出力での高電圧または低電圧が検出され、アラームが通知されます。

AC 電源の冗長性

AC 電源モジュールはモジュラ設計であるため、停止せずに交換できます。各シェルフには、最大 3 基の電源モジュールが搭載されています。図 3-1 に、最小および最大のモジュール構成を示します。完全にロードされたシステムに電源を投入するには、最低 1 つの完全にロードされた AC シェルフが必要です。各モジュールの出力は 3000 W です。


) Cisco ASR 9010 ルータの AC 電源冗長性では、2 つの電源シェルフが必要です。


Cisco ASR 9010 ルータでは、冗長電源シェルフに同数のモジュールが組み込まれている限り、シェルフ内でのモジュールのスロット位置は関係ありません。

Cisco ASR 9006 ルータでは、モジュールの数が N+1 である限り、シェルフ内でのモジュールのスロット位置は関係ありません。

図 3-1 AC システム電源の冗長性

 


) Cisco ASR 9010 ルータは、1 つの電源シェルフで運用できます。ただし、この構成では冗長性を実現できません。


DC 電源の冗長性

DC 電源モジュールはモジュラ設計であるため、停止せずに交換できます。各シェルフには、最大 3 基の電源モジュールを搭載できます。図 3-2 に、Cisco ASR 9010 ルータの最小および最大のモジュール構成を示します。Cisco ASR 9010 ルータでは、各 DC 電源モジュールの出力は 2100 W です。

Cisco ASR 9006 ルータには、使用可能な電源モジュールが 2 基(2100 W モジュールと 1500 W モジュール)搭載されています。両方のタイプの電源モジュールを単一の Cisco ASR 9006 ルータ シャーシで使用できます。電源モジュールの仕様については、 付録 A「技術仕様」 を参照してください。


) Cisco ASR 9010 ルータでは、DC 電源の冗長性には 2 つの電源シェルフが必要です。


モジュールの数が N+1 である限り、シェルフ内でのモジュールのスロット位置は関係ありません。

図 3-2 DC システム電源の冗長性

 


) Cisco ASR 9000 シリーズ ルータは、1 つの電源モジュールで運用できます。ただし、この構成では冗長性を実現できません。


冗長 -48 VDC 給電は、各電源シェルフに個別に供給されています。最大限の多様性を実現するために、各シェルフの電源入力ポイントは、シェルフの左端と右端に距離を置いて分けられています。それぞれの給電は、シェルフ全体で消費される電力をサポートできます。給電間で負荷分散は行われません。シェルフ内の各電源モジュールは、いずれかの給電から電源を得ています。このため、中断を発生させずに、給電のメンテナンスまたは交換を行うことができます。

電源問題の検出および報告

すべての -48 VDC 給電およびリターン ケーブルにはヒューズが取り付けられており、監視されています。ヒューズが飛ぶと、このことが検出されて報告されます。入力電圧は、高電圧および低電圧のアラームしきい値に照らして監視されます。Controller Area Network(CAN; コントローラ エリア ネットワーク)によって、出力電圧レベルが監視されます。

冷却システムの冗長性

Cisco ASR 9000 シリーズ ルータは、ファンの障害およびその後の交換で大幅な停止が発生しないように構成されています。ファンに障害が発生している間、またはファンを交換している間、エアーフローが維持されるため停止は発生しません。また、ファン トレイはホット スワップに対応しているため、交換時にも停止は発生しません。

Cisco ASR 9010 ルータには、カード シェルフの下部に 2 つのファン トレイがあります。各ファン トレイでは、12 のファンが 4 つずつ 3 つのグループに分けて配置されています。各グループの 2 つのファンが、1 つのファン コントローラを共有しています。ファン コントローラへの給電は、1:3 の保護です。1 つのファンに障害が発生しても、残りの 11 のファンがそれを補うため、エアー フローが滞ることはありません。ファン コントローラに障害が発生した場合は、最大 2 つのファンが機能しなくなる可能性がありますが、この設計では 2 つのファンが並んで機能しているため(3 列のファン)、気流速度が補われます。

Cisco ASR 9006 ルータには、シャーシの左上に 2 つのファン トレイがあります。各ファン トレイでは、6 つのファンが 2 つずつ 3 つのグループに分けて配置されています。各グループ内の 2 つのファンが、1 つのファン コントローラを共有しています。ファン コントローラへの給電は、1:3 の保護です。1 つのファンに障害が発生しても、残りの 5 つのファンがそれを補うため、エアーフローが滞ることはありません。ファン コントローラに障害が発生した場合は、最大 2 つのファンが機能しなくなる可能性がありますが、この設計では 2 つのファンが常に機能しているため、気流速度が補われます。


注意 1 つのファン トレイだけがシステムに設置されている場合、1 つのシングル ポイント障害によってすべてのファンが停止することはありません。ただし、このシステムはファン トレイなしでは機能できません。すべてのファン トレイを取り外すと、このシステムは自動的にシャット オフします。

冷却障害のアラーム

すべてのカードおよびファン トレイに温度センサーが搭載されています。これらのセンサーによって、ファンの障害または高温状態が検出され、アラームが通知されます。ファンの障害は、ファンの停止、ファン コントローラの障害、電源の障害、または RSP カードへの通信リンクの障害の原因となる場合があります。

各カードには、最高温度が予測される領域に温度測定ポイントが設置されているため、冷却に障害が発生した場合は明確に示されます。ラインカードには 2 つのセンサーがあり、1 つは吸気口に配置され、もう 1 つはカード上の最高温度となるデバイスの近くに配置されています。RSP カードも 2 つのセンサーを備えています。