Cisco NX-OS のハイアベイラビリティおよび冗長性ガイド Release 4.0
概要
概要
発行日;2012/01/07 | ドキュメントご利用ガイド | ダウンロード ; この章pdf , ドキュメント全体pdf (PDF - 534KB) | フィードバック

目次

概要

ハイ アベイラビリティについて

サービス レベル ハイ アベイラビリティ

プロセスの分離

プロセスの再起動性

サービス レベル ハイ アベイラビリティ

物理的な冗長性

ISSU

VDC

ネットワーク レベル ハイ アベイラビリティ

レイヤ 2 HA 機能

レイヤ 3 HA 機能

可用性のためのその他の管理ツール

GOLD

EEM

Smart Call Home

概要

Cisco NX-OSは、ネットワーク、システム、プロセスの各レベルにおけるハイ アベイラビリティを実現するために特別に設計された回復性の高いオペレーティング システムです。

この章では、ハイ アベイラビリティ(HA)の概念とCisco NX-OS デバイスの機能について説明します。この章の構成は次のとおりです。

「ハイ アベイラビリティについて」

「サービス レベル ハイ アベイラビリティ」

「サービス レベル ハイ アベイラビリティ」

「ネットワーク レベル ハイ アベイラビリティ」

「可用性のためのその他の管理ツール」

ハイ アベイラビリティについて

Cisco NX-OSは、ハードウェアまたはソフトウェア障害発生時のトラフィックの中断を防ぐ、または最小限に抑えるため、次の 3 つの機能を備えています。

冗長性 ― Cisco NX-OS HA では、物理的および環境的側面、電源、システム ソフトウェアなどあらゆるコンポーネント レベルにおいて、ハードウェアおよびソフトウェアの冗長性を実現しています。

各プレーンおよび各プロセスの分離 ― Cisco NX-OS HA では、デバイス内の各コントロール転送プレーンと各データ転送プレーン、および各ソフトウェア コンポーネントが分離されているため、あるプレーンで障害が発生しても他のプレーンが中断されることはありません。

再起動性 ― システムのほとんどの機能およびサービスは分離されているため、他のサービスを稼働し続けたまま、障害の発生したサービスだけを再起動できます。また、ほとんどのシステム サービスはステートフルな再起動を実行できるため、他のサービスへ透過的に動作を再開できます。

スーパーバイザの SSO ― Nexus 7000 シリーズは、アクティブ/スタンバイのデュアル スーパーバイザ構成をサポートしています。2 つのスーパーバイザ モジュール間で状態と設定が常に同期された状態に維持されるため、スーパーバイザ モジュールの障害発生時にシームレスかつステートフルなスイッチオーバーが可能です。

中断なしのアップグレード ― Cisco NX-OSでは、インサービス ソフトウェア アップグレード(ISSU)機能をサポートしています。これにより、スイッチのトラフィック転送動作を継続しながら、デバイス ソフトウェアをアップグレードできます。ISSU を使用すると、ソフトウェアのアップグレードによるダウンタイムを短縮するかゼロにすることができます。

サービス レベル ハイ アベイラビリティ

Cisco NX-OSでは、各コンポーネントを区分けするモジュラ方式のアーキテクチャを採用することにより、障害の分離、冗長性、リソースの効率利用を実現しています。

サービス レベル HA の詳細については、 第 2 章「サービス レベル ハイ アベイラビリティの理解」 を参照してください。

ここでは、次の内容について説明します。

「プロセスの分離」

「プロセスの再起動性」

プロセスの分離

Cisco NX-OSソフトウェアでは、 サービス と呼ばれる独立したプロセスが、サブシステムまたはフィーチャ セットの機能または機能セットを実行します。各サービスおよびサービス インスタンスは、独立した保護プロセスとして実行されます。このアプローチにより、高いフォールト トレラントを備えたソフトウェア インフラストラクチャとサービス間での障害の分離を実現できます。あるサービス インスタンス(802.1Q など)で障害が発生しても、その時点で実行されている他のサービス(Link Aggregation Control Protocol[LACP]など)に影響が及ぶことはありません。また、サービスの各インスタンスは独立したプロセスとして実行できるため、同じルーティング プロトコルの 2 つのインスタンス(たとえば、OSPF プロトコルの 2 つのインスタンス)を別々のプロセスとして実行できます。

プロセスの再起動性

Cisco NX-OS のプロセスは、保護メモリ領域内で互いに独立に、またカーネルとも独立に動作します。このようにプロセスが分離されているため、障害が閉じこめられ、迅速な再起動が可能になります。プロセスの再起動性により、プロセス レベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。また、大半のサービスはステートフルな再起動を実行できます。これにより、プラットフォーム内の他のサービス、およびネットワーク内の隣接デバイスへ透過的に、障害の発生したサービスを再起動し、動作を再開できます。

サービス レベル ハイ アベイラビリティ

Nexus 7000 シリーズは、冗長なハードウェア コンポーネントとハイ アベイラビリティ ソフトウェア フレームワークによってシステム障害から保護されています。

システム レベル HA 機能の詳細については、 第 3 章「システム レベル ハイ アベイラビリティの理解」 を参照してください。

ここでは、次の内容について説明します。

「物理的な冗長性」

「ISSU」

「VDC」

物理的な冗長性

Nexus 7000 シリーズは、次の物理的な冗長性を備えています。

電源の冗長性 ― Cisco Nexus 7000 シリーズ シャーシは、電源モジュールを 3 つまで搭載できます。各モジュールは内部的に分離された 2 つの電源ユニットで構成されているため、電源モジュールごとに 2 つの電源経路が、フル装備ではシャーシ全体で 6 つの電源経路が確保されます。

ファン トレイの冗長性 ― Cisco Nexus 7000 シリーズ シャーシは、I/O モジュールの冷却用に 2 つの冗長なシステム ファン トレイを備えており、さらに Switch Fabric Module(SFM; スイッチ ファブリック モジュール)の冷却用に 2 つのファン トレイを備えています。各ペアのファン トレイのどちらか一方が動作していれば、システムは充分冷却できます。ファン トレイで障害が発生しても、代わりのファン トレイが用意できるまで、故障したファンを装着したままにして、正常なエアーフローを確保する必要があります。ファン トレイはホットスワップ可能ですが、取り外しおよび取り付け作業を 3 分以内に完了しないと、システムが自動的にシャットダウンされます。

ファブリックの冗長性 ― Cisco NX-OS は、冗長な SFM によってスイッチング ファブリックの可用性を提供しています。1 台の Cisco Nexus 7000 シリーズ シャーシに 1 ~ 5 枚の Switch Fabric Card(SFC; スイッチ ファブリック カード)を装着して、容量と冗長性を高めることができます。システムに装着された各 I/O モジュールは、正しく装着されたすべての SFM に自動的に接続され、それらの機能を利用できます。いずれかの SFM で障害が発生すると、残りのアクティブな SFM 間で、自動的なトラフィックの再割り当てと均等化が実行されます。故障した SFM を置換すると、これとは逆のプロセスが実行されます。新しいファブリック モジュールを装着してオンラインにすると、装着されたすべてのファブリック モジュール間でトラフィックが再配分され、元の冗長性が復元されます。

スーパーバイザ モジュールの冗長性 ― Cisco Nexus 7000 シリーズ シャーシでは、プレーンの制御および管理機能の冗長性を実現するために、スーパーバイザ モジュールを 2 台搭載できます。デュアル スーパーバイザ構成は、アクティブ/スタンバイ構成で動作します。常に、どちらか一方のスーパーバイザ モジュールだけがアクティブ状態にあり、もう一方のモジュールはスタンバイ バックアップとして機能します。2 つのスーパーバイザ モジュール間で状態と設定が常に同期された状態に維持されるため、アクティブなスーパーバイザ モジュールの障害発生時にステートフルなスイッチオーバーが可能です。

Nexus 7000 シリーズの物理的な冗長性の詳細については、 第 3 章「システム レベル ハイ アベイラビリティの理解」 を参照してください。

ISSU

Cisco NX-OSを使用すると、インサービス ソフトウェア アップグレード(ISSU)を実行できます(ISSU は中断なしのアップグレードとも呼ばれます)。NX-OS では、モジュラ方式のソフトウェア アーキテクチャによって、サービスおよびフィーチャをプラグイン ベースでサポートしています。これにより、スーパーバイザおよびスイッチング モジュールのイメージの完全なアップグレードを、他のモジュールにほとんど、あるいはまったく影響を与えることなく実行できます。この設計によって、データ フォワーディング プレーンに影響を及ぼさず NX-OS を中断なしにアップグレードができるため、フル バージョンアップのときでも、アップグレード中にフォワーディングを中断せずに済みます。

ISSU の詳細については、 第 5 章「インサービス ソフトウェア アップグレードの理解」 を参照してください。

VDC

Cisco NX-OSは、デバイス レベルでの論理的な仮想化を実装しています。これにより、物理的に同じスイッチ上で、1 つのデバイスで複数のインスタンスを同時に実行できます。こうした論理的な動作環境を 仮想デバイス コンテキスト (VDC)と呼びます。VDC では、論理的に切り離されたデバイス環境によって、設定および管理が個別にできます。この高い分離性によって、セキュリティ上および管理上の利点が得られるだけでなく、障害を分離することができます。手動による操作ミスや設定に起因する障害は、所定の仮想デバイス内に隔離されます。仮想デバイス コンテキストは元来、ハイ アベイラビリティ機能ではありませんが、障害ドメインが機能的に独立しているため、可用性が向上し、デバイスの設定に関連するサービスの停止を防ぐことができます。

VDC の詳細については、『 Cisco NX-OS Virtual Device Context Configuration Guide 』Release 4.0 を参照してください。

ネットワーク レベル ハイ アベイラビリティ

ネットワーク コンバージェンスは、フェールオーバーとフォールバックを透過的かつ高速にするツールや機能によって最適化されています。

ネットワーク レベル HA 機能の詳細については、 第 4 章「ネットワーク レベル ハイ アベイラビリティの理解」 を参照してください。

ここでは、次の内容について説明します。

「レイヤ 2 HA 機能」

「レイヤ 3 HA 機能」

レイヤ 2 HA 機能

Cisco NX-OSレイヤ 2 HA 機能

Bridge Protocol Data Unit(BPDU; ブリッジ プロトコル データ ユニット)ガード、ループ ガード、ルート ガード、BPDU フィルタ、Bridge Assurance などの Spanning Tree Protocol(STP; スパニング ツリー プロトコル)の改良により、STP コントロール プレーンのヘルス状態を保証

UniDirectional Link Detection(UDLD; 単一方向リンク検出)プロトコル

Shortest Path First(SPF; 最短パス優先)の最適化。Link-State Advertisement(LSA; リンクステートアドバタイズメント)ペーシングや SPF の増大など。

IEEE 802.3ad リンク アグリゲーション

レイヤ 3 HA 機能

Cisco NX-OSは、次のレイヤ 3 HA 機能を提供しています。

ノンストップ フォワーディング(NSF)グレースフル リスタートによるルーティング プロトコルの拡張

OSPFv2、OSPFv3、Intermediate System to Intermediate System (IS-IS)、Enhanced Interior Gateway Routing Protocol (EIGRP)、および Border Gateway Protocol (BGP) は、基本プロトコルに対してグレースフル リスタート拡張を適用して、それぞれの環境で、ノンストップ フォワーディングと中断を最小限にするルーティング リカバリを実現します。

プロトコル ベースの定期リフレッシュ

Hot Standby Router Protocol(HSRP; ホットスタンバイ ルータ プロトコル)、Gateway Load Balancing Protocol(GLBP; ゲートウェイ ロード バランシング プロトコル)、Virtual Router Redundancy Protocol(VRRP; 仮想ルータ冗長プロトコル)などの First-Hop Redundancy Protocol(FHRP; ファーストホップ冗長プロトコル)用のタイマー(ミリ秒)。

可用性のためのその他の管理ツール

Cisco NX-OSには、システム可用性イベントのモニタリングと通知を行うシスコのシステム管理ツールがいくつか組み込まれています。

ここでは、次の内容について説明します。

「GOLD」

「EEM」

「Smart Call Home」

GOLD

Cisco Generic On-Line Diagnostics(GOLD; 汎用オンライン診断)サブシステムとスーパーバイザ上の追加のモニタリング プロセスによって、回復不可能な重大な障害、サービス再起動エラー、カーネル エラー、ハードウェア障害が検出されると、冗長なスーパーバイザへのステートフル フェールオーバーの起動が容易になります。

GOLD の設定の詳細については、『 Cisco NX-OS System Management Configuration Guide 』 Release 4.0 を参照してください。

EEM

Cisco Embedded Event Manager(EEM; 組み込みイベント マネージャ)は、Event Detector(イベント ディテクタ)、Event Manager(イベント マネージャ)、Event Manager Policy Engine(イベント マネージャ ポリシー エンジン) で構成されます。EEM を使用すると、システム ソフトがイベント ディテクタを介して特定のイベントを察知したときに、特定のアクションを実行するポリシーを定義できます。これにより、多数のネットワーク管理タスクを自動化し、Cisco NX-OS の動作を管理して可用性の向上、情報の収集、重要なイベントの外部システムまたは個人への通知が柔軟に行える、ツール セットが実現します。

EEM の設定の詳細については、『 Cisco NX-OS System Management Configuration Guide 』Release 4.0 を参照してください。

Smart Call Home

Cisco GOLD および Cisco EEM の機能を組み合わせた Smart Call Home は、重要なシステム イベントを E メールで通知するためのツールです。メッセージ形式には、ポケットベル サービス、標準の E メール、または XML ベースの自動解析アプリケーションと互換性があります。この機能を使用して、ネットワーク サポート エンジニアをポケットベルで呼び出したり、ネットワーク オペレーション センターに E メールで通知したりできます。また、Cisco Smart Call Home のサービスを使用すると、Cisco TAC に自動的に障害を報告できます。

Smart Call Home の設定の詳細については、『 Cisco NX-OS System Management Configuration Guide 』Release 4.0 を参照してください。