概要
概要

概要

Cisco NX-OS は、ネットワーク、システム、プロセスの各レベルにおけるハイ アベイラビリティを実現するために特別に設計された回復性の高いオペレーティング システムです。

この章では、Cisco NX-OS デバイスのハイ アベイラビリティ(HA)の概念および機能について説明します。この章は、次の項で構成されています。

ハイ アベイラビリティに関する情報

ハードウェアまたはソフトウェア障害発生時のトラフィックの中断を防止または最小限に抑えるために、Cisco NX-OS には次の機能があります。

  • 冗長性:Cisco NX-OS HA では、物理的および環境的側面、電源、システム ソフトウェアなどあらゆるコンポーネント レベルにおいて、ハードウェアおよびソフトウェアの冗長性を実現しています。

  • 各プレーンおよび各プロセスの分離:Cisco NX-OS HA では、デバイス内の各コントロール転送プレーンと各データ転送プレーン、および各ソフトウェア コンポーネントが分離されているため、あるプレーンで障害が発生しても他のプレーンが中断されることはありません。

  • 再起動性:ほとんどのシステム機能およびサービスが分離されているため、エラーが発生しても、他のサービスは実行され続けている中で独立して再起動が可能。 さらに、ほとんどのシステム サービスはステートフルな再起動を実行するため、その他のサービスに対して透過的に稼働を再開できます。

  • スーパーバイザ ステートフル スイッチオーバー:Nexus 7000 シリーズは、アクティブとスタンバイのデュアル スーパーバイザ構成をサポートします。 2 つのスーパーバイザ モジュール間で状態と設定が常に同期された状態に維持されるため、スーパーバイザ モジュールの障害発生時にシームレスかつステートフルなスイッチオーバーが可能です。

  • 中断なしのアップグレード:Cisco NX-OS では、インサービス ソフトウェア アップグレード(ISSU)機能をサポートしています。これにより、スイッチのトラフィック転送動作を継続しながら、デバイス ソフトウェアをアップグレードできます。 ISSU を使用すると、ソフトウェアのアップグレードによるダウンタイムを短縮するかゼロにすることができます。

サービスレベル ハイ アベイラビリティ

Cisco NX-OS では、各コンポーネントを区分けするモジュラ方式のアーキテクチャを採用することにより、障害の分離、冗長性、リソースの効率利用を実現しています。

サービスレベル HA の詳細については、サービスレベル ハイ アベイラビリティを参照してください。

プロセスの分離

Cisco NX-OS ソフトウェアでは、サービスと呼ばれる独立したプロセスが、サブシステムまたはフィーチャ セットの機能または機能セットを実行します。 各サービスおよびサービス インスタンスは、独立した保護プロセスとして実行されます。 このアプローチにより、高いフォールト トレラントを備えたソフトウェア インフラストラクチャとサービス間での障害の分離を実現できます。 あるサービス インスタンス(802.1Q など)で障害が発生しても、その時点で実行されている他のサービス(Link Aggregation Control Protocol(LACP)など)に影響が及ぶことはありません。 また、サービスの各インスタンスは独立したプロセスとして実行できるため、同じルーティング プロトコルの 2 つのインスタンス(たとえば、Open Shortest Path First(OSPF)プロトコルの 2 つのインスタンス)を別々のプロセスとして実行できます。

プロセスの再起動性

Cisco NX-OS のプロセスは、保護メモリ領域内で互いに独立して、またカーネルとも独立して動作します。 このようにプロセスが分離されているため、障害が閉じこめられ、迅速な再起動が可能になります。 プロセスの再起動性により、プロセスレベルの障害によってシステム全体に障害が及ぶのを防ぐことができます。 また、大半のサービスはステートフルな再起動を実行できます。これにより、プラットフォーム内の他のサービス、およびネットワーク内の隣接デバイスへ透過的に、障害の発生したサービスを再起動し、動作を再開できます。

システムレベルのハイ アベイラビリティ

Nexus 7000 シリーズは、冗長なハードウェア コンポーネントとハイ アベイラビリティ ソフトウェア フレームワークによってシステム障害から保護されています。

システム レベル HA 機能の詳細については、システムレベルのハイ アベイラビリティを参照してください。

物理的な冗長性

Nexus 7000 シリーズは、次の物理的な冗長性があります。

  • 電源の冗長性:Cisco Nexus 7000 シリーズのシャーシは、電源モジュールを Cisco Nexus 7010 スイッチで 3 つまで、Cisco Nexus 7018 スイッチで 4 つまで搭載できます。各モジュールは内部的に分離された 2 つの電源ユニットで構成されているため、電源モジュールごとに 2 つの電源経路が、フル装備ではシャーシ全体で 6 つの電源経路が確保されます。

  • ファン トレイの冗長性:Cisco Nexus 7010 のシャーシには、入出力モジュールの冷却用に 2 つの冗長なシステム ファン トレイが備えられており、さらにスイッチ ファブリック モジュールの冷却用に 2 つの冗長なファン トレイが備えられています。 各ペアのファン トレイのどちらか一方が動作していれば、システムは十分に冷却できます。 故障した Cisco Nexus 7010 ファン トレイを交換する時間制限はありませんが、十分な通気を確保するため、障害が発生したファン トレイをそのままにします。

    Cisco Nexus 7018 のシャーシには 2 つのファン トレイが備えられています。各トレイは、シャーシ内のモジュールを冷却するために必要です。 上側のファン トレイはスロット 1 ~ 9、およびファブリック モジュールを冷却します。 下側のファン トレイはスロット 10 ~ 18 を冷却します。 これらのファン トレイはそれぞれホット スワップ可能ですが、取り外し作業を 3 分以内に完了しないと、スイッチがシャットダウンされます。

  • ファブリックの冗長性:Cisco NX-OS は、冗長なスイッチ ファブリック モジュールによってスイッチング ファブリックの可用性を実現しています。 1 台の Cisco Nexus 7000 シリーズのシャーシに 1 ~ 5 枚のスイッチ ファブリック カードを装着して、容量と冗長性を高めることができます。 システムに装着された各入出力モジュールは、SFM モジュールに自動的に接続され、それらの機能を利用できます。 いずれかの SFM で障害が発生すると、残りのアクティブな SFM 間で、自動的にトラフィックの再割り当てと均等化が行われます。 故障した SFM を置換すると、これとは逆のプロセスが実行されます。 新しいファブリック モジュールを装着してオンラインにすると、装着されたすべてのファブリック モジュール間でトラフィックが再配分され、元の冗長性が復元されます。

  • スーパーバイザ モジュールの冗長性:Cisco Nexus 7000 シリーズ シャーシは、コントロール プレーンおよびマネジメント プレーンに冗長性を提供するために、デュアル スーパーバイザ モジュールをサポートします。 デュアル スーパーバイザ構成は、アクティブ/スタンバイ構成で動作します。常に、どちらか一方のスーパーバイザ モジュールだけがアクティブ状態にあり、もう一方のモジュールはスタンバイ バックアップとして機能します。 2 つのスーパーバイザ モジュール間で状態と設定が常に同期された状態に維持されるため、アクティブなスーパーバイザ モジュールの障害発生時にステートフルなスイッチオーバーが可能です。

ISSU

Cisco NX-OS を使用すると、インサービス ソフトウェア アップグレード(ISSU)を実行できます(ISSU は中断なしのアップグレードとも呼ばれます)。 Cisco NX-OS では、モジュラ方式のソフトウェア アーキテクチャによって、サービスおよびフィーチャをプラグイン ベースでサポートしています。これにより、スーパーバイザおよびスイッチング モジュールのイメージの完全なアップグレードを、他のモジュールにほとんど、あるいはまったく影響を与えることなく実行できます。 この設計によって、データ フォワーディング プレーンに影響を及ぼさずに Cisco NX-OS を中断なしにアップグレードができるため、フル バージョンアップのときでも、アップグレード中にフォワーディングを中断せずに済みます。

ISSU の詳細については、ISSU およびハイ アベイラビリティを参照してください。

VDC

Cisco NX-OS は、デバイス レベルでの論理的な仮想化を実装しています。これにより、物理的に同じスイッチ上で、1 つのデバイスで複数のインスタンスを同時に実行できます。 こうした論理的な動作環境を仮想デバイス コンテキスト(VDC)と呼びます。 VDC では、論理的に切り離されたデバイス環境によって、設定および管理が個別にできます。 この高い分離性によって、セキュリティ上および管理上の利点が得られるだけでなく、障害を分離することができます。 手動による操作ミスや設定に起因する障害は、所定の仮想デバイス内に隔離されます。 仮想デバイス コンテキストは元来、ハイ アベイラビリティ機能ではありませんが、障害ドメインが機能的に独立しているため、可用性が向上し、デバイスの設定に関連するサービスの停止を防ぐことができます。

VDC の詳細については、『Cisco Nexus 7000 Series NX-OS Virtual Device Context Configuration Guide』を参照してください。

ネットワークレベル ハイ アベイラビリティ

ネットワーク コンバージェンスは、フェールオーバーとフォールバックを透過的かつ高速にするツールや機能によって最適化されています。

ネットワーク レベル HA 機能の詳細については、ネットワークレベル ハイ アベイラビリティを参照してください。

レイヤ 2 HA 機能

Cisco NX-OS には、次のレイヤ 2 HA 機能が備わっています。

  • ブリッジ プロトコル データ ユニット(BPDU)ガード、ループ ガード、ルート ガード、BPDU フィルタ、Bridge Assurance などのスパニングツリー プロトコル(STP)の改良により、STP コントロール プレーンのヘルス状態を保証

  • UniDirectional Link Detection(UDLD; 単一方向リンク検出)プロトコル

  • IEEE 802.3ad リンク アグリゲーション


    (注)  


    Cisco NX-OS Release 4.1(3) 以降のリリースでは、仮想ポート チャネル(vPC)によって、論理シングル リンクとして動作する 2 つのシステム間に冗長な物理リンクを作成できます。


レイヤ 3 HA 機能

Cisco NX-OS には、次のレイヤ 3 HA 機能が備わっています。

  • ノンストップ フォワーディング(NSF)グレースフル リスタートによるルーティング プロトコルの拡張

    OSPFv2、OSPFv3、Intermediate System to Intermediate System (IS-IS)、Enhanced Interior Gateway Routing Protocol (EIGRP)、および Border Gateway Protocol (BGP) は、基本プロトコルに対してグレースフル リスタート拡張を適用して、それぞれの環境で、ノンストップ フォワーディングと中断を最小限にするルーティング リカバリを実現します。

  • Shortest Path First(SPF; 最短パス優先)の最適化。Link-State Advertisement(LSA; リンクステートアドバタイズメント)ペーシングや SPF の増大など。

  • プロトコル ベースの定期リフレッシュ

  • Hot Standby Router Protocol(HSRP; ホットスタンバイ ルータ プロトコル)、Gateway Load Balancing Protocol(GLBP; ゲートウェイ ロード バランシング プロトコル)、Virtual Router Redundancy Protocol(VRRP; 仮想ルータ冗長プロトコル)などの First-Hop Redundancy Protocol(FHRP; ファーストホップ冗長プロトコル)用のタイマー(ミリ秒)。

可用性のためのその他の管理ツール

Cisco NX-OS には、システム可用性イベントのモニタリングと通知用の複数の Cisco システム管理ツールが組み込まれています。

汎用オンライン診断(GOLD)

Cisco 汎用オンライン診断(GOLD)サブシステムとスーパーバイザ上の追加のモニタリング プロセスによって、回復不可能な重大な障害、サービス再起動エラー、カーネル エラー、ハードウェア障害が検出されると、冗長なスーパーバイザへのステートフル フェールオーバーの起動が容易になります。

GOLD の設定の詳細については、『Cisco Nexus 7000 Series NX-OS System Management Configuration Guide』を参照してください。

Cisco Embedded Event Manager(EEM)

Cisco Embedded Event Manager(EEM)は、Event Detector、Event Manager、Event Manager Policy Engine で構成されます。 EEM を使用すると、システム ソフトが Event Detector を介して特定のイベントを察知したときに、特定のアクションを実行するポリシーを定義できます。 これにより、多数のネットワーク管理タスクを自動化し、Cisco NX-OS の動作を管理して可用性の向上、情報の収集、重要なイベントの外部システムまたは個人への通知を柔軟に行える、ツール セットが実現します。

EEM の設定については、『Cisco Nexus 7000 Series NX-OS System Management Configuration Guide』を参照してください。

Smart Call Home

Cisco GOLD および Cisco EEM の機能を組み合わせた Smart Call Home は、重要なシステム イベントを E メールで通知するためのツールです。 メッセージ形式には、ポケットベル サービス、標準の E メール、または XML ベースの自動解析アプリケーションと互換性があります。 この機能を使用して、ネットワーク サポート エンジニアをポケットベルで呼び出したり、ネットワーク オペレーション センターに E メールで通知したりできます。また、Cisco Smart Call Home のサービスを使用すると、Cisco Technical Assistance Center(TAC)に自動的に障害を報告できます。

Smart Call Home の設定の詳細については、『Cisco Nexus 7000 Series NX-OS System Management Configuration Guide』を参照してください。