Cisco ASR 9000 シリーズ アグリゲーション サービス ルータの 概要およびリファレンス ガイド
ハイ アベイラビリティおよび冗長運用
ハイ アベイラビリティおよび冗長運用
発行日;2012/02/03 | 英語版ドキュメント(2011/12/22 版) | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 4MB) | フィードバック

目次

ハイ アベイラビリティおよび冗長運用

機能の概要

ハイ アベイラビリティ ルータの運用

ステートフル スイッチオーバー

ファブリック スイッチオーバー

アクティブ/スタンバイのステータスの解釈

ノンストップ フォワーディング

ノンストップ ルーティング

グレースフル リスタート

プロセスの再開性

障害の検出および管理

電源の冗長性

AC 電源の冗長性

DC 電源の冗長性

電源問題の検出および報告

冷却システムの冗長性

冷却障害のアラーム

ハイ アベイラビリティおよび冗長運用

この章では、Cisco ASR 9000 シリーズ アグリゲーション サービス ルータのハイ アベイラビリティおよび冗長性について説明します。

機能の概要

Cisco ASR 9000 シリーズ ルータは、高い Mean Time Between Failure(MTBF; 平均故障間隔)レートおよび低い Mean Time To Resolve(MTTR; 平均解決時間)レートを実現するように設計されており、停止やダウンタイムを最小限に抑え、最大限のアベイラビリティを確保する信頼性のあるプラットフォームを提供しています。

また、Cisco ASR 9000 シリーズ ルータは、ネットワーク レベルの復元力を強化し、ネットワーク全体の保護を可能にするために、次の High Availability(HA; ハイ アベイラビリティ)機能を提供しています。

ハイ アベイラビリティ ルータの運用

ステートフル スイッチオーバー

ファブリック スイッチオーバー

ノンストップ フォワーディング

プロセスの再開性

障害の検出および管理

電源の冗長性

冷却システムの冗長性

ハイ アベイラビリティ ルータの運用

Cisco ASR 9000 シリーズ ルータは、ハードウェアおよびソフトウェアのさまざまなハイ アベイラビリティ機能を提供しています。

ステートフル スイッチオーバー

Route Switch Processor(RSP; ルート スイッチ プロセッサ)カードが「アクティブ/スタンバイ」構成で展開されています。スタンバイ RSP カードへのスイッチ オーバーが発生した場合は、Stateful Switchover(SSO; ステートフル スイッチオーバー)により、ステート情報と構成情報が保存されます。スタンバイ RSP カードには、プロトコルのステート、ユーザ設定、インターフェイス ステート、加入者ステート、システム ステート、およびその他のパラメータのミラー イメージが含まれています。ハードウェアやソフトウェアの障害がアクティブ RSP カードで発生すると、スタンバイ RSP カードのステートが変更され、アクティブ RSP カードになります。このステートフル スイッチオーバーによる転送トラフィックへの影響はありません。

ファブリック スイッチオーバー

ファブリックの大半は RSP カードで構成されています。ファブリックは、トラフィックの負荷を両方の RSP カードに分散できる、「アクティブ/アクティブ」構成モデルで構成されています。障害が発生した場合は、1 つの「アクティブ」スイッチ ファブリックがシステムでのトラフィックの転送を続行します。

アクティブ/スタンバイのステータスの解釈

各 RSP カードのステータス信号をモニタリングして、ステータスがアクティブ/スタンバイのいずれであるか、および RSP カード間でのスイッチオーバーが必要な障害が発生したかどうかが判別されます。

ノンストップ フォワーディング

Cisco IOS XR ソフトウェアでは、コントロール プレーンが短時間停止してもトラフィックを消失することなくパケットを転送できる、Non-Stop Forwarding(NSF; ノンストップ フォワーディング)がサポートされています。NSF は、Internet Engineering Task Force(IETF; インターネット技術特別調査委員会)で標準化された、グレースフル リスタート拡張用のシグナリング実装とルーティング プロトコル実装を使用して実装されています。

たとえば、特定のソフトウェア モジュールのソフト リブートによって、ネットワーク プロセッサ、スイッチ ファブリック、またはパケット転送の物理インターフェイス操作が妨害されることはありません。同様に、非データ パス デバイス(イーサネット アウトオブバンド チャネル ギガビット イーサネット スイッチなど)のソフト リセットの場合も、パケット転送に影響を与えません。

ノンストップ ルーティング

Nonstop Routing(NSR; ノンストップ ルーティング)を使用すると、プロセッサのスイッチオーバーが行われた後にルーティング プロトコル情報がリフレッシュされる間、既知のルートを使用してデータ パケットの転送を続行できます。NSR によって、MPLS VPN などのサービス用の SSO 機能全体でプロトコル セッションやステート情報が維持されます。TCP 接続およびルーティング プロトコル セッションは、RSP スイッチオーバーがピアに通知されずに実行された後、アクティブ RSP カードからスタンバイ RSP カードに移行されます。スタンバイ RSP がアクティブになると、セッションが終了し、スタンバイ RSP カード上で実行されているプロトコルによってセッションが再確立されます。また、NSR をグレースフル リスタートで使用して、スイッチオーバー時にルーティング コントロール プレーンを保護することもできます。NSR の機能は、Open Shortest Path First Protocol(OSPF)および Label Distribution Protocol(LDP; ラベル配布プロトコル)のルーティング テクノロジーにだけ使用できます。

グレースフル リスタート

Graceful Restart(GR; グレースフル リスタート)によって、Nonstop Forwarding(NSF; ノンストップ フォワーディング)サービスが維持されると同時に、障害状態の検出および回復を可能にするハイ アベイラビリティを確保するためにコントロール プレーン メカニズムが提供されています。グレースフル リスタートは、フォワーディング プレーンに影響を与えずに、シグナリングおよびコントロール プレーンの障害から回復する方法です。Cisco IOS XR ソフトウェアでは、グレースフル リスタートを使用し、チェック ポインティング、ミラーリング、ルート スイッチ プロセッサ冗長性、およびその他のシステム復元機能を組み合わせて使用することによって、タイムアウトの前の状態を回復し、ネットワークの再収束によるサービス ダウンタイムを回避します。

プロセスの再開性

Cisco IOS XR 分散およびモジュラ マイクロカーネル オペレーティング システムを使用して、プロセスの独立性、再開性、およびメモリ ステートや動作ステートのメンテナンスが可能になります。各プロセスは、保護されたアドレス レンジで実行されます。チェック ポインティング機能、および信頼性の高い転送機能と再送信機能を使用すると、トラフィックの中断を最小限に抑えるか、または中断なしで、他のコンポーネントに影響を与えずにプロセスをリスタートできます。プロセスは通常、失敗、異常終了、または何らかの障害が発生すると、自動的にリスタートします。たとえば、Border Gateway Protocol(BGP; ボーダー ゲートウェイ プロトコル)または Quality of Service(QoS)プロセスは、障害が発生した場合、他のプロセスに影響を与えずにリスタートして通常のルーチンを再開します。

障害の検出および管理

Cisco ASR 9000 シリーズでは、単一または複数のシステム コンポーネントに対して、またはネットワーク障害に対して迅速かつ効率的に対応することによって、サービスの停止を最小限に抑えています。ローカルな障害処理では深刻な障害から回復できない場合、システムによって、堅牢な障害検出、修正、フェールオーバー、およびイベント管理の機能が提供されます。

障害の検出および修正:Cisco ASR 9000 シリーズ ルータには、ハードウェアに Error Correction Code(ECC; エラー訂正コード)保護メモリが含まれています。メモリが破損すると、影響を受けたプロセスが自動的にリスタートされ、影響を最小限に抑えて問題が解決されます。問題が解決されない場合、ASR 9000 では、システム内の他のハードウェア コンポーネントのサービスに影響を与えずに欠陥のあるハードウェアを交換できるように、スイッチオーバー機能および Online Insertion and Removal(OIR; 活性挿抜)機能がサポートされています。

リソース管理:Cisco ASR 9000 シリーズ ルータでは、Out of Resource(OOR; リソース不足)管理を強化するために、CPU およびメモリ使用率に関するリソースしきい値モニタリングがサポートされています。しきい値の条件を満たすか、または超過した場合は、OOR アラームが生成され、オペレータに OOR 状態が通知されます。次に、自動回復が試行され、オペレータは組み込みのイベント マネージャを使用して柔軟なポリシーを設定できます。

オンライン診断:Cisco ASR 9000 シリーズ ルータは、ネットワーク パス障害の検出、パケット方向転換失敗の検出、欠陥のあるファブリック リンクの検出などの機能をモニタリングするために、組み込みのオンライン診断を提供しています。これらのテストは、CLI を使用して設定できます。

イベント管理:Cisco ASR 9000 シリーズ ルータは、ラボ テストでハードウェア障害を検出するための障害注入テストなどのメカニズム、失敗したプロセスを回復するためのウォッチドッグ メカニズム、およびルーティング テーブルと転送テーブル間の不整合を診断するための Route Consistency Checker などのツールを提供しています。

電源の冗長性

Cisco ASR 9000 シリーズ ルータは、電源モジュールの障害およびその後の交換で大幅な停止が発生しないように構成されています。

電源の障害、または電源モジュールの出力における高電圧または低電圧が検出され、アラームが通知されます。

AC 電源の冗長性

AC 電源モジュールはモジュラ設計であるため、停止せずに交換できます。各シェルフには、最大 3 基の電源モジュールが搭載されています。図 3-1 に、最小および最大モジュール構成を示します。完全にロードされたシステムに電源を投入するには、最低 1 つの完全にロードされた AC シェルフが必要です。各モジュールの出力は 3000 W です。


) Cisco ASR 9010 ルータの AC 電源冗長性では、2 つの電源シェルフにそれぞれ電源モジュールが取り付けられている必要があります。


Cisco ASR 9010 ルータでは、(1 つのシェルフに障害が発生した場合に備え)2 つの電源シェルフに同数のモジュールが組み込まれている限り、電源シェルフ内でのモジュールのスロット位置は関係ありません(図 3-1 を参照)。

Cisco ASR 9006 ルータでは、モジュールの数が N+1 である限り、シェルフ内でのモジュールのスロット位置は関係ありません。

図 3-1 Cisco ASR 9010 ルータの AC システム電源の冗長性

 


) Cisco ASR 9010 ルータは、いずれか 1 つの電源シェルフに取り付けられた電源モジュールで運用できます。ただし、この構成では冗長性を実現できません。


DC 電源の冗長性

DC 電源モジュールはモジュラ設計であるため、停止せずに交換できます。各シェルフには、最大 3 基の電源モジュールを搭載できます。図 3-2 に Cisco ASR 9010 ルータの最小および最大モジュール構成を示します。

Cisco ASR 9000 シリーズ ルータには、使用可能な電源モジュールが 2 基(2100 W モジュールと 1500 W モジュール)搭載されています。両方のタイプの電源モジュールを単一のシャーシで使用できます。電源モジュールの仕様については、 付録 A「技術仕様」 を参照してください。

モジュールの数が N+1 である限り、シェルフ内でのモジュールのスロット位置は関係ありません。

図 3-2 Cisco ASR 9010 ルータの DC システム電源の冗長性

 


) Cisco ASR 9000 シリーズ ルータは、1 つの電源モジュールで運用できます。ただし、この構成では冗長性を実現できません。


冗長 -48 VDC 給電は、各電源シェルフに個別に供給されています。最大限の多様性を実現するために、各シェルフの電源入力ポイントは、シェルフの左端と右端に距離を置いて分けられています。それぞれの給電は、シェルフ全体で消費される電力をサポートできます。給電間で負荷分散は行われません。シェルフ内の各電源モジュールは、いずれかの給電から電源を得ています。このため、中断を発生させずに、給電のメンテナンスまたは交換を行うことができます。

電源問題の検出および報告

すべての -48 VDC 給電およびリターン ケーブルにはヒューズが取り付けられており、モニタリングされています。ヒューズが飛ぶと、このことが検出されて報告されます。入力電圧は、高電圧および低電圧のアラームしきい値に照らしてモニタリングされます。Controller Area Network(CAN; コントローラ エリア ネットワーク)によって、出力電圧レベルがモニタリングされます。

冷却システムの冗長性

Cisco ASR 9000 シリーズ ルータは、ファンの障害およびその後の交換で大幅な停止が発生しないように構成されています。ファンに障害が発生している間、またはファンを交換している間、エアーフローが維持されるため停止は発生しません。また、ファン トレイはホット スワップに対応しているため、交換時にも停止は発生しません。

Cisco ASR 9010 ルータには、カード シェルフの下部に 2 つのファン トレイがあります。各ファン トレイでは、12 のファンが 4 つずつ 3 つのグループに分けて配置されています。各グループの 2 つのファンが、1 つのファン コントローラを共有しています。ファン コントローラへの給電は、1:3 の保護です。1 つのファンに障害が発生しても、残りの 11 のファンがそれを補うため、エアーフローが滞ることはありません。ファン コントローラに障害が発生した場合は、最大 2 つのファンが機能しなくなる可能性がありますが、この設計では 2 つのファンが並んで機能しているため(3 列のファン)、気流速度が補われます。

Cisco ASR 9006 ルータには、シャーシの左上に 2 つのファン トレイがあります。各ファン トレイでは、6 つのファンが 2 つずつ 3 つのグループに分けて配置されています。各グループ内の 2 つのファンが、1 つのファン コントローラを共有しています。ファン コントローラへの給電は、1:3 の保護です。1 つのファンに障害が発生しても、残りの 5 つのファンがそれを補うため、エアーフローが滞ることはありません。ファン コントローラに障害が発生した場合は、最大 2 つのファンが機能しなくなる可能性がありますが、この設計では 2 つのファンが常に機能しているため、気流速度が補われます。


注意 1 つのファン トレイだけがシステムに搭載されている場合、1 つのシングル ポイント障害によってすべてのファンが停止することはありません。ただし、このシステムはファン トレイなしでは機能できません。すべてのファン トレイを取り外すと、このシステムは自動的にシャット オフし、このシステムは Shutdown Temperature Threshold(STT; シャットダウン温度しきい値)を超過します。

冷却障害のアラーム

すべてのカードおよびファン トレイに温度センサーが搭載されています。これらのセンサーによって、ファンの障害または高温状態が検出され、アラームが通知されます。ファンの障害は、ファンの停止、ファン コントローラの障害、電源の障害、または RSP カードへの通信リンクの障害の原因となる場合があります。

各カードには、最高温度が予測される領域に温度測定ポイントが設置されているため、冷却に障害が発生した場合は明確に示されます。ラインカードには 2 つのセンサーがあり、1 つは吸気口に配置され、もう 1 つはカード上の最高温度となるデバイスの近くに配置されています。RSP カードも 2 つのセンサーを備えています。