データセンター

ユニファイド ファブリック:データセンター ネットワークのためのシスコの技術革新


ユニファイド ファブリック: データセンター ネットワークのためのシスコの技術革新


概要

この文書で取り上げるユニファイド ファブリックは、イーサネットの堅牢性を強化する IEEE データセンター ブリッジング拡張機能などの新しい概念をサポートしており、ネットワークの統合による総運用コストの削減や応答性の改善を可能にします。この文書では、イーサネットをベースにしたデータセンター ネットワークの開発をサポートして、アプリケーションの新しい要求をサポートするシスコの取り組みについて説明します。他のアプローチには何が不足しているかについても述べ、データセンターの次世代型イーサネット ネットワークの要件を満たすアーキテクチャとなるためにユニファイド ファブリックが何を実現するかを説明します。

イントロダクション

イーサネットは、データセンター内のリソースを相互接続するためのネットワークとして広く採用されています。イーサネットは全世界で普及しており、十分な知識を持つネットワーク エンジニアや開発者も世界中に存在します。競合するテクノロジーの挑戦をものともせず、イーサネットはデータセンター ネットワーク環境における一般的な選択肢という地位を長年にわたって守り続けてきました。アプリケーションからは次々と新しい要求が持ち上がるため、ネットワーキング インフラストラクチャに新しい機能を追加することが必要になり、その結果、アプリケーション固有の独立したネットワークが複数展開されるようになっています。企業のデータセンターでは一般的に、イーサネット ネットワークを展開して IP トラフィックを処理し、1 つまたは 2 つのストレージ エリア ネットワーク(SAN)を展開してブロック モードのファイバ チャネル トラフィックを処理しており、高パフォーマンスのクラスタ化コンピューティングのために InfiniBand ネットワークを展開する例も頻繁にみられます(図 1)。3 種類のネットワークを別々に展開して管理するのに要する資本コストと運用コストはかなり高額になります。ユニファイド ファブリックを利用してこれらのネットワークを統合すれば、3 重投資を抑えることができます。

図 1. 3 種類のデータセンター ネットワーク

図 1 3 種類のデータセンター ネットワーク
※画像をクリックすると、大きな画面で表示されますpopup_icon


この 3 種類のネットワークを技術面から評価すると、3 種類のネットワークの要件のほとんどを満たすことができるという点でイーサネットを使って統合するのが最良と判断できます。しかしそのためには、いくつかの追加機能が必要です。IEEE データセンター ブリッジングは、ユニファイド ファブリック上で複数ネットワーク インフラストラクチャの統合を可能にする、標準ベースの機能をイーサネットに追加します。

この技術は、特にデータセンターにおけるイーサネット ネットワーキングの役割と管理を強化するために設計されたイーサネットのアーキテクチャ拡張機能の集合です。IEEE データセンター ブリッジングには、大きく 2 つの面があります。1 つはユニファイド ファブリック上での I/O 統合をサポートするためのイーサネット機能拡張で、異なるクラスのトラフィックをファブリック上で別々にやりとりします。2 つめはノードロップ サービスのサポートで、確実な配信が必要なトラフィックを、無損失(ロスレス)ファブリックを介して転送することが可能になります。

ネットワーク統合のビジネス面での利点の一つに、コストの削減があります。統一されたイーサネット インフラストラクチャならば、運用が簡単になり、イーサネット ネットワーキング エンジニアの既存のスキルを十分に活用できます。また、管理ツールの数が減り、新しいネットワークの導入に要する時間も短縮されます。さらに、統合されたデータセンター ネットワークでは、既存のレイヤ 2 ネットワークのすべての機能を実行します。イーサネットに関する機能としては、マルチキャストおよびブロードキャスト トラフィック、VLAN、リンク アグリゲーションなどのサポートがあり、ファイバ チャネル関連の機能としては、ファイバ チャネルの全サービスのプロビジョニング(ゾーン分割やネーム サーバなど)と、仮想 SAN(VSAN)、VSAN 間ルーティング(IVR)などのサポートがあります。

データセンター ネットワークの進化

イーサネットが前進し続け、データセンター ネットワークが進化し続けた結果、今ではアプリケーションはネットワークをリソースの一つとして使用するようになっています。ネットワークに対する要求はこれまでとは異なってきており、従来のクライアント/サーバ トランザクションを処理するだけにはとどまりません。たとえば、サーバ クラスタの展開が増加した結果、サーバ間トラフィックが増加します。グリッド コンピューティングも、サーバ間トラフィック増加の一因です。定期的なストレージ バックアップの必要性が増えた結果、サーバ ファームと SAN 上のストレージ デバイスの間のトラフィックが増加しています。さらに、ストレージ デバイス間のサーバレス バックアップが現在では一般的に行われているため、ディスクとディスク、およびディスクとテープの間のトラフィックが増加しています。現在では、データセンターのトラフィックはクライアントからサーバ、サーバからサーバ、サーバからストレージ、ストレージからストレージへと移動しています。

このような全体的なトラフィック増加とトラフィック パターンの変化の結果、サーバ クラスタ アプリケーションをサポートするのに必要なスループットを実現するにあたって、ネットワークの重要性がますます高まっています。現在では、アプリケーションのパフォーマンスを評価するときはネットワークのパフォーマンスも評価されます。つまり、帯域幅と遅延の両方が重要です。送信されるトラフィック タイプごとの違いもあります。クライアントとサーバの間およびサーバとサーバの間のトランザクションでは、短時間に大量のデータが送信されます。サーバからストレージへのアプリケーションのほとんど、および純粋にストレージのみのアプリケーションでは、長時間にわたる一定のメッセージ フローが必要です。これには、柔軟さに加えて、ネットワーク インテリジェンスを持つことがネットワーク アーキテクチャに求められます。ネットワーク ダイナミクスの変化をサポート、検出、対応できるようにするためです。

また、アプリケーションがパケット ドロップを処理する能力にも違いがみられます。パケット ドロップの影響はプロトコルごとに異なり、対応のしかたもアプリケーションごとに異なります。アプリケーションによってはドロップが発生しても続行が可能で、再送信すればドロップからの回復ができるものもあります。イーサネットはこのようなケースをサポートしていますが、パケット ロスをいっさい許容しないアプリケーションもあり、エンドツーエンドの転送においてドロップが発生しない(ノードロップ)という保証を必要としています。イーサネットを介して送信されるファイバ チャネル トラフィックは、ノードロップ サービスを必要とするアプリケーションの一例です。パケット ドロップが発生してはならないアプリケーションをイーサネット ネットワークでサポートするには、イーサネット上でのロスレス(無損失)サービス クラスを実現する方法の確立が必要です。IEEE データセンター ブリッジングに含まれる、トラフィック管理のための拡張機能は、このことを可能にします。

データセンター ネットワークは、大規模でフラットな設計に対応できることも必要です。データセンター ネットワークが拡張を続けてサーバやスイッチの数が増えると、大規模な既存のフラットなレイヤ 2 ネットワーク ドメインがさらに大きくなります。これはごく普通のことであり、決して例外ではありません。

ネットワーク統合のための他の選択肢

データセンター ネットワーク統合のための選択肢はイーサネットだけではありませんが、他の選択肢と比較すると、成功の可能性が最も高いのはイーサネットです。ファイバ チャネルには、再送信によるペナルティを避けるために、ネットワーク輻輳時もノードロップ サービスが可能な信頼できる転送手段が必要です。ファイバ チャネル トラフィックをイーサネット上でネイティブに、ドロップなしで転送することはイーサネットの課題でした。優先度ベース フロー制御(PFC; Priority-based Flow Control)によってロスレス イーサネットが実現し、FCoE(Fibre Channel over Ethernet)によってネイティブでのファイバ チャネル カプセル化が可能になります。

iSCSI

イーサネットベースの iSCSI(Small Computer System Interface over IP)は、ファイバ チャネルの代替として、イーサネット上でブロック ストレージ転送を統合できるものと考えられていました。iSCSI は多くのストレージ アプリケーションで、特に中堅・中小企業(SMB)で一般的に使用されていますが、大企業での重要なストレージ メディア転送用に広く採用されているファイバ チャネルをしのぐ、あるいは置き換えるには至っていません。その理由の一つは、パケット ドロップなしのサービスを保証できなかったイーサネット インフラストラクチャに重要なストレージ メディアの転送を託せるかという不安感です。ファイバ チャネルに代わる手段としての iSCSI の採用が進んでいないもう一つの理由は、SAN 管理者が頼みとしてきたファイバ チャネル ネイティブのサービスやツールを iSCSI がサポートしていないことです。

10 ギガビット イーサネットが加わるだけで、純粋なパフォーマンス ベースでは iSCSI が FCoE に取って代わるという意見もあります。その観点から言えば、FCoE も、10 ギガビット イーサネット上で転送すればスピードがアップします。ファイバ チャネルにとっては、リンク速度よりもデータの信頼性と整合性のほうが重要です。したがって、無損失でイーサネット通信ができることは魅力的です。そして、iSCSI には TCP/IP オーバーヘッドという課題もあります。このオーバーヘッドによって、サーバ上の CPU 使用量が増加しますが、 TCP/IP なくして iSCSI がストレージ トラフィックを確実に、フレームの入れ替わりなく順番どおりに配信することはできません。TCP/IP オフロード エンジンがネットワーク アダプタのハードウェアに応用されていますが、このアプローチでは特別な ASIC(特定用途向け集積回路)が必要になるため、インターフェイスのコストが増加する可能性があります。

InfiniBand

InfiniBand も、データセンター ネットワークを統合するためのテクノロジーの候補として位置づけられています。InfiniBand は、低遅延を必要とします。InfiniBand はファイバ チャネル ネットワークおよびイーサネット ネットワークへのゲートウェイとなりますが、別の並列ネットワークの構築が必要です。また、イーサネット ネットワークは非常に普及が進んでいるので、企業の IT 部門が自社のイーサネット ベースのインフラストラクチャを InfiniBand に移行することはあまり考えられません。これはコスト効率の点では良い方法ではないからです。段階的に増築していくことになり、管理のオーバーヘッドが増えます。また、InfiniBand を運用していくには、イーサネット IP ネットワーキングのスタッフに長時間のトレーニングを受けさせて InfiniBand を習得させることが不可欠です。InfiniBand サブネット間で相互接続できないことも、InfiniBand が克服すべき課題の一つです。データセンターの規模が拡大して共有リソースが必要になったときは、InfiniBand サブネットどうしを InfiniBand ルータで接続することになりますが、現在、このようなルータは存在しません。10 ギガビット イーサネット標準で定められている帯域幅は、10 Gbps InfiniBand の帯域幅を上回ります。InfiniBand は 10 ビットを使って 8 ビットのデータをエンコードするので、ライン レートで 20% のロスが生じ、データ リンク レイヤで利用可能な帯域幅は 8 Gbps までとなります。10 ギガビット イーサネットは 10 Gbps のスループットで送信できるので、10 ギガビット イーサネット リンクの実ライン レートが達成されます。

今日ではすべてのサーバ クラスタの 80% がイーサネット インフラストラクチャを介して稼動していると考えると、最も良い選択肢は、イーサネット上で実行されるサーバ クラスタおよびグリッド コンピューティングのアプリケーションの比率を高めること、またそのためにイーサネットの機能を強化することです。10 ギガビット イーサネットのための RDMA(Remote Direct Memory Access)ドライバの開発は、おそらく避けては通れないでしょう。低遅延で高スループットのイーサネットをメモリ リソースに直接接続することが必要です。また、IEEE データセンター ブリッジングでは無損失(ロスレス)トランスポート クラスが利用できることも、サーバ クラスタ アプリケーションにとっては好都合です。

IEEE データセンター ブリッジング

IEEE データセンター ブリッジングは、従来のイーサネットが持つ強みを活用するように熟考を重ねて作られたアーキテクチャです。データセンター ネットワークの次世代インフラストラクチャとなるための重要な拡張機能が多数追加されており、Cisco Data Center 3.0 アーキテクチャで約束されているユニファイド ファブリックを実現します。この文書の残りの部分では、IEEE データセンター ブリッジングの概要を紹介します。また、アーキテクチャの主要コンポーネントのそれぞれが堅牢なイーサネット ネットワーク作りにどのように寄与し、今日のアプリケーションの増加しつつある要件を満たし、将来のデータセンター ネットワークのニーズに応えるかについて説明します。

優先度ベース フロー制御:IEEE 802.1Qbb

リンク シェアリングは、I/O を統合するためには欠かせません。リンク シェアリングを成功させるには、あるトラフィック タイプの大規模なバーストが発生しても他のトラフィック タイプには影響が及ばないようにする必要があります。また、あるトラフィック タイプのキューが巨大化したために他のトラフィック タイプのリソースが不足することや、あるトラフィック タイプを最適化したために他のトラフィック タイプの小さなメッセージに大きな遅延が発生することがないようにする必要があります。イーサネットのポーズ(一時停止)メカニズムを使用すると、トラフィック タイプが他のトラフィック タイプに与える影響を制御できます。優先度ベース フロー制御(PFC)は、このポーズ メカニズムの機能を拡張したものです(図 2)。

図 2 優先度ベース フロー制御(PFC; Priority-based Flow Control)

図 2 優先度ベース フロー制御(PFC; Priority-based Flow Control)
※画像をクリックすると、大きな画面で表示されますpopup_icon


現在のイーサネット ポーズ オプションは、1 つのリンク上のトラフィックをすべて停止させるので、実質的にはリンク全体に対するリンク ポーズです。PFC によって、物理リンク上に 8 つの独立したバーチャル リンクが作成され、これらのリンクを個別に一時停止および再始動することができます。このアプローチを採用したネットワークでは、特定の独立したバーチャル リンクに対してノードロップ サービス クラスを作成できます。このバーチャル リンクは、他のトラフィック タイプと同じインターフェイス上で共存できます。PFC を利用すれば、差別化した QoS(Quality-of-Service)ポリシーを 8 つのバーチャル リンクのそれぞれに適用できます。また、PFC は、イントラスイッチ ファブリックの調停モジュールと共に使用されるときに、入力ポートを出力ポートのリソースにリンクさせるという重要な役割を果たします(後述の「パケット ロスのないファブリック」、IEEE 802.1Qbb、および http://www.ieee802.org/1/files/public/docs2007/new-cm-barrass-pause-proposal.pdf を参照)。

拡張伝送選択:IEEE 802.1Qaz

PFC によって 1 つの物理リンク上に 8 種類のバーチャル リンクを作成できますが、各バーチャル リンクの中で異なるトラフィック クラスを定義できることが有利になる場合があります。同じ PFC IEEE 802.1p クラス内のトラフィックを 1 つのグループにまとめる一方で、各グループの中でトラフィックごとに扱いを変えることができます。Enhanced Transmission Selection(ETS; 拡張伝送選択)によって、帯域幅割り当て、低遅延、またはベスト エフォートに基づいて処理の優先順位が付けられ、結果としてグループごとにトラフィック クラスが割り当てられます。バーチャル リンクの概念を広げて、ネットワーク インターフェイス コントローラ(NIC)が仮想インターフェイス キュー(トラフィック クラスごとに 1 つずつ)を持つようになります。各仮想インターフェイス キューは、そのトラフィック グループ用に割り当てられた帯域幅の管理を担当しますが、グループ内で動的にトラフィックを管理する柔軟性を持っています。たとえば、IP クラス トラフィック用のバーチャル リンク 3 に高優先度が指定されており、その同じクラスの中でベスト エフォートが指定されており、このバーチャル リンク 3 クラスは他のトラフィック クラスと共にリンク全体の一定の割合を占めているとします。ETS によって、同じ優先度クラスの中でトラフィックを差別化できるようになり、このようにして優先度グループが作成されます(図 3)。

現在の IEEE 802.1p 実装では、優先度に基づくキューの厳格なスケジューリングが指定されています。ETS を導入した環境では、柔軟でドロップが発生しないキュー スケジューリング機能によってトラフィックに優先順位を付けることができます。この基準となるのは、IEEE 802.1p トラフィック クラスと、各優先度グループ内で指定されたトラフィック処理階層です。同じ優先度クラス内でトラフィックごとに差別化した処理を適用できるようにするには、ETS を実装します(IEEE 802.1Qaz、http://www.ieee802.org/1/pages/802.1az.html を参照)。

図 3 拡張伝送選択

図 3 拡張伝送選択
※画像をクリックすると、大きな画面で表示されますpopup_icon


DCBX(Data Center Bridging Exchange)プロトコル

DCBX(Data Center Bridging Exchange)プロトコルは、シスコ、Nuova、および Intel によって開発された、検出および機能交換のためのプロトコルです。IEEE データセンター ブリッジングに採用されており、ピアを検出して DCB に準拠したブリッジ間で構成情報を交換するために使用されています(図 4)。次に示す IEEE データセンター ブリッジングのパラメータを DCBX で交換できます(http://www.ieee802.org/1/files/public/docs2008/az-wadekar-dcbcxp-overview-rev0.2.pdf を参照)。

  • ETS の優先度グループ
  • PFC
  • 輻輳通知
  • アプリケーション
  • 論理リンクダウン
  • ネットワーク インターフェイス仮想化
図 4 DCBX(Data Center Bridging Exchange)プロトコル

図 4 DCBX(Data Center Bridging Exchange)プロトコル
※画像をクリックすると、大きな画面で表示されますpopup_icon


輻輳通知:IEEE 802.1Qau

輻輳通知(Congestion Notification)とは、輻輳を引き起こしているトラフィックをシェーピングするようにレート リミッタに指示することによって、輻輳をネットワークのエッジへと押しやるトラフィック管理機能です。IEEE 802.1Qau ワーキング グループは、輻輳通知に関するシスコの提案を受け入れました。これは、トラフィックの混雑を回避するために積極的にトラフィック フローを管理するアーキテクチャを定義するものです。

輻輳は、輻輳しているポイントにおいて計測され、輻輳が発生している場合はリアクションすべきポイントにおいてレート制限(バック プレッシャー)が課せられます。これによってトラフィック シェーピングが行われ、ネットワークの他の部分への輻輳の影響が低減されます。このアーキテクチャでは、送出するトラフィックの量を絞るように指示する制御フレームを、アグリゲーション レベル スイッチから 2 つのアクセス レベル スイッチに送信することができます(図 5)。このアプローチでは、ネットワークのコアの完全性は維持され、影響を受けるのはネットワークの輻輳を引き起こしている部分、一番発生源に近いところだけとなります(IEEE 802.1Qau、http://www.ieee802.org/1/pages/802.1au.html を参照)。

図 5 輻輳通知

図 5 輻輳通知
※画像をクリックすると、大きな画面で表示されますpopup_icon


シスコ ユニファイド ファブリックに関連する標準と拡張機能

Cisco Nexus データセンター スイッチには、IEEE データセンター ブリッジングに加えて、標準ベースのレイヤ 2 マルチパス化や FCoE(Fibre Channel over Ethernet)などの拡張機能、およびユニファイド ファブリックの構築を可能にするロスレス ファブリックが含まれます。ここでは上記の各概念の概要について説明します。

レイヤ 2 マルチパス化

等コスト マルチパス ルーティングは、現在はレイヤ 3 では実装されています。標準化団体からは、等コスト マルチパス化をレイヤ 2 で実現するためのいくつかの代替案が提案されています。TRILL(TRansparent Interconnection of Lots of Links)は、IETF 標準化グループで提案されたソリューションの一つです。また、最短(Shortest)パス ブリッジング(IEEE 802.1Qat)の評価が IEEE によって行われています。

レイヤ 2 マルチパス化(L2MP)によって、ノード間で複数の並列パスでの通信が可能になるためバイセクション帯域幅が増大し、その結果、相互接続ネットワークの帯域幅が増大し、遅延が低減します。L2MP は、大規模なサーバ ファームのトラフィック パターンに基づいてこれらのネットワークのパフォーマンスを増強します。代替の等コスト パス間でトラフィックの負荷が分散されるため、アプリケーションのパフォーマンスとネットワークの復元力が向上します。IEEE データセンター ブリッジングに L2MP を組み合わせることで、ノード間の使用可能な接続がすべて使用されるようになり、単一パスの制約が排除されます。また、パスを削除または追加したときのコンバージェンスの影響を意識することなく、データセンターのトポロジを動的に変更できるようになります。

I/O 統合

10 ギガビット イーサネットの普及拡大が続いていることから、さまざまなタイプが混在したトラフィックがサーバとスイッチド ネットワークの間で転送されるようになっています。IEEE データセンター ブリッジングの拡張機能(PFC、ETS、DCBX、および輻輳通知)によって、10 ギガビット イーサネット接続で複数のトラフィック タイプを同時に、トラフィックごとの処理は維持しながらサポートできるようになります。これらの拡張機能によって、同じ 10 ギガビット イーサネット リンクでファイバ チャネル ストレージ トラフィックもサポートできるようになり、FCoE トラフィックはドロップなしで伝送されます。FCoE をサポートするサーバにおいて I/O が統合されると、すべてのホストが共通のユニファイド ファブリックを介してストレージ リソースにアクセスできるようになります。

サーバ アーキテクチャの変化は、ユニファイド ファブリックへの移行に影響を及ぼしています。PCI-Express(Peripheral Component Interconnect Express)が PCI や PCI-X に代わって採用された結果、サーバの PCI バスにおける I/O ボトルネックは克服されました。この根本的な変化によって、サーバは 10 ギガビット イーサネット インターフェイスをフルに活用できるようになりました。同時に、サーバで高密度チップ、クアッド コア、マルチプロセッサ プラットフォームが使用されることから、サーバの入出力の帯域幅の需要が増加しています。複数のプロセッサ、コア、および仮想マシンが 1 つのサーバに搭載されるようになれば、10 ギガビット イーサネットの普及はさらに進みます。そして、大規模な、I/O を統合した接続においてトラフィック シェアリングを可能にするには、複数のトラフィック タイプを同時に管理する手段が不可欠です。

統合された I/O リンクでは、マルチプロトコル トラフィックを 1 本のケーブルだけでユニファイド ファブリックに渡すことができます。ユニファイド ファブリックとは、1 つのイーサネット トランスポート上で複数のプロトコルを扱うことで、IP トラフィックとファイバ チャネル トラフィックの同時転送を可能にするものです。これらのトラフィックは同じインターフェイス、同じスイッチ ファブリックを介して転送されますが、サービス クラスの差別化は維持されます。マルチプロトコル トランスポート、FCoE、低遅延イーサネット経由の RDMA などに利用されます。

図 6 ユニファイド ファブリック

図 6 ユニファイド ファブリック
※画像をクリックすると、大きな画面で表示されますpopup_icon


IEEE データセンター ブリッジングの標準ベースの仕様を実装している製品は、同じ仕様セットを実装している他の製品との間に互換性を持つことになります。データセンター ブリッジングのエンドポイント(ホスト、ターゲット、サーバなど)に最小限必要なものは、PFC、ETS、および DCBX です。シスコのデータセンター ブリッジング対応スイッチは、IEEE データセンター ブリッジングに加えて、ノードロップ サービスと L2MP の機能を持つロスレス イントラスイッチ ファブリック アーキテクチャもサポートします。

パケット ロスのないファブリック

IEEE データセンター ブリッジングでは定義されていませんが、データセンター スイッチはロスレス伝送サービス クラスがドロップなしで確実にフレームを伝達できるロスレス アーキテクチャを備えている必要があります。FCoE をサポートするには、ストレージ トラフィックのノードロップ サービスの保証に役立つロスレス ファブリックが必須です。マルチプロトコルをサポートするロスレス イーサネット ファブリックを作成するには、2 つの要素が必要です。1 つは優先度ベースのポーズ メカニズム(PFC)、もう 1 つはインテリジェントなスイッチ ファブリック調停(Arbitration)メカニズムです。この調停メカニズムとは、ポーズ要件を満たすために入力ポート トラフィックを出力ポートのリソースに結びつけるというものです。

現在のイーサネットの標準的なポーズ メカニズムでは、リンク上のすべてのトラフィック タイプが停止します。PFC が I/O 統合に不可欠なのは、同じ物理リンク上に 8 つの独立した論理リンクを作成して 8 つのトラフィック タイプをそれぞれ個別に一時停止させることができるからです。一時停止しても、他のトラフィック タイプのフローが中断されることはありません。PFC は、物理リンク上の IEEE 802.1p トラフィックのうちどのタイプのトラフィックを一時停止させるかを、優先度ベースのポーズ メカニズムを使用して選択します。差別化されたトラフィック タイプごとに一時停止ができるので、トラフィックを単一のインターフェイス上で統合することが可能になります。

PFC は、論理リンクごとにノードロップを可能にすることに加えて、論理トラフィック タイプを個別に停止させる能力を持ちます。PFC(および標準のポーズ メカニズム)によって、リンクは無損失(ロスレス)になりますが、ネットワークをロスレス ファブリックにするには不十分です。リンク上のノードロップ サービスに加えて、入力ポートの一時停止動作を出力ポート リソースに結び付ける手段が、PFC を使用するイントラスイッチ ファブリック全体で必要です。ネットワークをロスレスにするには、各スイッチが入力リンクのリソースを出力リンクのリソースに関連付ける必要があります。出力ポート リソースの可用性の情報を入力ポート トラフィックに論理的に結びつけることで、調停が可能になり、パケット ドロップなしの保証に役立ちます。これが、ロスレス スイッチ ファブリック アーキテクチャの定義です。このロスレス イーサネット イントラスイッチ ファブリックの動作によって、必須のノードロップ サービスが実現します。これは、現在のファイバ チャネル スイッチにみられるバッファ クレジット管理システムをエミュレートするものです。

FCoE(Fibre Channel over Ethernet)

ファイバ チャネル ストレージ トラフィックやその他の無損失サービスを必要とするアプリケーションをイーサネット ネットワーク上で転送してユニファイド ファブリックを実現するには、無損失サービス クラスが必要です。ファイバ チャネル ストレージ トラフィックは、ドロップなしで転送できることが必要です。ノードロップのトラフィック クラスは、IEEE データセンター ブリッジングとロスレスのイーサネット スイッチ ファブリックを使用して作ることができます。

FCoE プロトコルは、ネイティブのファイバ チャネル フレームをイーサネットを介してマッピングします。これは、ネイティブのイーサネット転送方式とは独立して行われます。ファイバ チャネルの構造体がすべて維持されるため、I/O 統合の実現に大きく近づきます。

INCITS T11 は、FCoE の標準規格を作成しています。この標準では、FCoE をサポートするにはロスレス イーサネット ネットワークが必須であると規定される予定です。標準のポーズ メカニズム(および PFC)によってリンクはロスレスになりますが、ポーズも PFC も、それだけではネットワークをロスレスにすることはできません。ネットワークをロスレスにするには、各スイッチが入力リンクのバッファと出力リンクのバッファとを相互に関連付けることと、これらをポーズの実装に結び付けることが必要です。これは、プラットフォーム アーキテクチャの機能の一つであり、プロトコルとは無関係です。Cisco® Nexus 5000 シリーズ スイッチはすでにこの機能を備えています。Cisco® Nexus 7000 シリーズ スイッチは、このロスレス ネットワーク機能を将来実現する予定です。

ユニファイド ファブリックは主としてデータセンター ネットワークの機能を強化する目的で設計されており、拡張機能のほとんどは、シスコのデータセンター向け製品に搭載される予定です。ユニファイド ファブリックは多数のコンポーネント(IEEE データセンター ブリッジングや IETF TRILL)で構成されているため、特定のプラットフォームでは拡張機能の少なくとも一部が追加される予定です。さらに、すべての企業が統合型イーサネット ネットワーク上でのロスレス サービスの実行やユニファイド ファブリックの展開を必要としているわけではなく、このような企業では従来のイーサネットが現在と同様に今後も展開されます。

まとめ

ユニファイド ファブリックは、今日の Cisco Data Center 3.0 のビジョンで約束されているものを満たすアーキテクチャです。単一の統合型ファブリックで複数のトラフィック タイプをサポートできるようにするには、イーサネットが当然の選択肢です。イーサネットは世界各地のデータセンターに広く導入されているため、エンジニアリングや運用の知識を持つ専門家も全世界に存在します。FCoE は、ユニファイド ファブリックの最初の使用例です。IEEE データセンター ブリッジングの拡張機能でイーサネットでのロスレス通信が可能になり、ノードロップというファイバ チャネルの要件にも対応できます。

イーサネット ファブリック上でのロスレス サービスが確立すれば、FCoE や RDMA、iSCSI およびリアルタイム ビデオなどのアプリケーションと他の競合するアプリケーションとの混在を可能にするノードロップのバーチャル リンクによって、これらのアプリケーションの配信が保証されるようになります。L2MP の技術革新は、イーサネット ネットワーク上で SAN トラフィックを統合するかどうかにかかわらず、すべてのデータセンター イーサネット ネットワークにとって利点があります。L2MP による帯域幅の増加と遅延低減の結果、すべてのアプリケーションのパフォーマンスが向上します。IEEE データセンター ブリッジングの拡張機能、ロスレス転送機能、および L2MP は、Cisco Nexus 7000 シリーズおよび Cisco Nexus 5000 シリーズをはじめとするシスコの次世代スイッチ ファミリに搭載されています。これらは、データセンター ユニファイド ファブリック アーキテクチャに不可欠な要素となります。

このデータセンターのための新しい拡張機能には、IT 部門から見たさまざまな利点があります。まず、新しい柔軟な方法で、I/O をイーサネット経由で同じネットワーク ファブリック上で統合できるため、複数の独立したネットワークをサポートすることは不要になります。また、イーサネット上でロスレスのトラフィック クラスを配信できるようになります。さらに、レイヤ 2 での等コスト マルチパス化を使用することでノード間の帯域幅利用率が高まり、バイセクション トラフィック量が増加します。差別化された複数のトラフィック タイプを同じインターフェイス、ケーブル、およびスイッチ上で統合するための方法は、今後も進化を続けます。柔軟性の高さが特徴のユニファイド ファブリックは、統合されたインターフェイス、リンク、およびスイッチ ファブリック上で何を実行するかの選択が可能で、その移行をいつ行うかも選択できるようになっています。

関連情報

参考 Web サイト

IEEE データセンター ブリッジング: http://www.cisco.com/jp/go/dcb/

優先度ベース フロー制御 IEEE 802.1Qbb [英語]: http://www.ieee802.org/1/pages/802.1bb.html

拡張伝送選択 IEEE 802.1Qaz [英語]:http://www.ieee802.org/1/pages/802.1az.html

輻輳通知 IEEE 802.1Qau [英語]: http://www.ieee802.org/1/pages/802.1au.html

DCBX の説明 [英語]: http://www.ieee802.org/1/files/public/docs2008/az-wadekar-dcbcxp-overview-rev0.2.pdf

関連する標準

IETF TRILL(Transparent Interconnection of Lots of Links) [英語]: http://www.ietf.org/html.charters/trill-charter.html

お問い合わせ