ユーザ事例大学がグリッド コンピューティングと高速ネットワーキングを開拓フロリダ大学の共同研究における計算およびネットワーク スループットで 100 倍増を実現 概要フロリダ大学、高性能コンピューティング センターおよびキャンパス グリッド プロジェクト
ビジネス上の課題
ネットワーク ソリューション
ビジネス上の効果
ビジネス上の課題研究教育(R&E:Research and Education)コミュニティは、高性能コンピューティング(HPC)およびネットワーキングを利用するだけでなく、これらに必要な基礎テクノロジーの進歩にも貢献しています。伝統的に、研究チームはそれぞれが独自のインフラストラクチャを設計、展開、および運用していました。ただし、このようなリソースのサイロ化によって、研究者や教育者の関心がコンピュータに向けられ、実業であるはずの研究に集中できなくなっていました。また、システムとネットワークが複雑になるにつれて、サポートと費用の問題も大きくなってきました。その結果、大学の情報技術(IT)チームが果たす役割は大きくなっています。 フロリダ大学 CIO、Marc Hoit 氏は次のように述べています。「フロリダ大学で HPC リソースを調整するための努力は何年も前に始まり、HPC 委員会から HPC センターへと発展しました。チームおよび学部間でリソースを調整することは、IT にとって大きな意味がありました。無駄な労力を費やさず、共通の要件を識別し、個別に存在していたクラスタやネットワークの能力を大幅に超えたインフラストラクチャを提供することができました。」 キャンパスに存在する組織間の壁を乗り越えるために HPC センターの設立が進められていた頃、物理学部では共有コンピューティング グリッドと高速接続への要求が高まっていました。フロリダ大学物理学部の科学者、Paul Avery 氏は次のように述べています。「シミュレーションは科学研究の重要な位置を占めています。物理学コミュニティの中で、私たちはかなり長い間共有コンピューティングに利用していましたが、今は化学、生物学、医学、地学といった他の多くの分野が演算グリッドと高速ネットワークを使用して、これまでは年単位だったシミュレーション時間を週単位に短縮しています。」 教授陣による地道な努力が結集され、IT と経営陣のサポートを得て、キャンパス規模のグリッド コンピューティングの次世代モデルへの移行に向けて動き出しました。具体的な要件として、大規模シミュレーションで求められる計算能力とデータ移動のソリューションがありました。さらに、全国的および国際的な R&E コミュニティに拡大する共同研究プロジェクトを推し進めるために、キャンパス ネットワークとデータ移動のソリューションを全国的なネットワークに組み入れる必要があります。 「シスコとのパートナーシップは不可欠です。(中略)キャンパス内の機能は 2 桁増強され、共同研究で得られた成果は、将来の世代の商業利用可能なソリューションをよりよいものにするために役立てられます。」 ネットワーク ソリューションフロリダ大学のキャンパス グリッド コンピューティング イニシアティブは、以下のように段階的に実行されました。
NSF の助成金の獲得はフェーズ 2 にとってきわめて重要でしたが、追加のサポートを得るにはプロジェクトの全面的な成功が必要でした。フロリダ大学は、ネットワーキング パートナーであるシスコとともに、クラスタのサーバ ファブリックの相互接続の設計、展開、および研究、ならびに高速クラスタ間接続およびフロリダ ラムダレール(FLR)とナショナル ラムダレール(NLR)への接続に投資するために、共同研究プロジェクトに加わりました。シスコと大学の間に築かれた長年の関係と、キャンパス内および FLR と NLR インフラストラクチャ内の両方における今までのシスコ ネットワーキング ソリューションの展開を背景に、共同プロジェクトはインフラストラクチャをうまく活用して、今までに例のない信頼性、処理能力、およびパフォーマンスを備えたソリューションを導入しました。 フロリダ大学 HPC センター長 Erik Deumens 氏は次のように述べています。「シスコとのパートナーシップは不可欠です。HPC とデータ管理における当大学の専門家と、シスコで最良のネットワーキング アーキテクトおよびエンジニアが連携することによって、通常では得られないような成果を達成できました。そのことを誇らしく思います。キャンパス内の機能は 2 桁増強され、共同研究で得られた成果は、将来の世代の商業利用可能なソリューションをよりよいものにするために役立てられます。」 Hoit 氏は次のように述べています。「多くの会社から私たちと組みたいという申し出がありますが、彼らの目的は製品を売りつけることです。シスコとは、真のパートナーシップを築いています。私たちは資金とリソースを注ぎ込んで、大規模演算グリッド内での最新テクノロジーについて、新しい研究ソリューションと潜在的な使用に関する知識を得ました。」 フロリダ大学のキャンパス グリッド コンピューティング イニシアティブが提供するプラットフォームから、研究者はオープン サイエンス グリッド(OSG)に参加できます。OSG は共有インフラストラクチャを共同で展開および所有するメンバーから成る関連コンソーシアムで、米国、南米、およびアジアの約 40 か所に拠点があります。高速ネットワークは現在 20,000 以上のプロセッサを接続し、さまざまな科学の分野に共同のプラットフォームを提供しています。メンバーは、単体では実現不可能なインフラストラクチャにアクセスできます。フロリダ大学とそのパートナーとしてのシスコは、生産と科学分野での研究プロジェクトの両方のために OSG を使用して、新しいグリッド テクノロジーをテストできます。 「新しいグリッド インフラストラクチャ、そして他の高速 R&E ネットワークとの接続により、コミュニティ全体における当大学の e-Science の地位は大幅に強化されました。シスコとの作業を通じて、よりよいソリューションを設計して構築する方法を学びました。」 ビジネス上の効果フェーズ 2 が完了した時点で、大学は共同研究チームがより多くの計算能力にアクセスできるようにすると同時に、キャンパス内外のクラスタ リソース間で非常に大量のデータ セットを移動できるようにしました。新しい計算、ストレージ、およびネットワーキングの機能は、さまざまな共同研究プロジェクトに以下のような大きな好影響をもたらします。
Hoit 氏は次のように述べています。「キャンパス グリッド コンピューティングとネットワーキング イニシアティブの価値は、研究者と大学全体に直接的な影響を及ぼしています。大学は、研究者と資金を求める競争を強いられています。新しいグリッド インフラストラクチャ、そして他の高速 R&E ネットワークとの接続により、コミュニティ全体における当大学の e-Science の地位は大幅に強化されました。インフラストラクチャは研究プログラムを豊かにすると同時に、HPC およびストレージにおける当大学のリーダーシップを強調することになります。シスコとの作業を通じて、よりよいソリューションを設計して構築する方法を学びました。私たちは、リーダーであり続けるために、どこで資金を節約でき、どこに資金を注ぎ込む必要があるかを理解しています。」 高速グリッドを利用することで、研究者の作業方法が変わりつつあります。以前は、データ移動がボトルネックでした。科学者は、必要なデータ セットが管理可能になるまで問題の単純化を何度も繰り返していました。今では、データ セットは数百テラバイト、さらにはペタバイト単位にまで容易に拡大することができます。キャンパス内グリッドと、より大きい OSG および国内の他の計算リソースへの高速接続によるアクセスにより、完全な状態のデータセットを使用して問題に取り組むことと、共同作業を行うチーム間で大きいデータ セットを共有して、複数の視点や並行的なアプローチを適用することが可能になります。 Avery 氏は次のように述べています。「私たちの行動の 3 分の 2 は社会的なものです。他の研究者との連携は非常に重要です。ネットワークはコミュニケーションを促進します。ビデオ会議などのリアルタイム形式で情報を中継することができます。高速キャンパス ネットワークにおける最新の進歩は、非常に大きなサイズのデータも別の場所に移動できることです。データの移動が可能であれば、データを理解して問題を解決するために必要な、より多くの専門知識を集めることができます。この状態は医学の分野ではすでに進行しており、医者が国内の別の医者に約500 M バイトの医学画像を送信できます。この種の便利なコラボレーションを分子研究、環境の研究、または物質の起源の発見に適用することで、科学のさまざまな分野で革命的な進歩のドアを開いてきました。」 「物理学のように共同研究が盛んな分野では、研究の進捗がサイバー インフラストラクチャに左右されます。シスコとの作業から、巨大なチームが力を発揮するために必要なネットワーキング能力を得ました。(中略)今回の進歩は、今後何年にもわたって世界経済に直接影響を与えることでしょう。」 次のステップフェーズ 3 では、グリッド コンピューティングおよびネットワーキングの設備を健康科学センターと生命科学部で利用できるようになります。これらのチームは、コンピュータへの依存度は低いものの、Web 形式のインターフェイスを使用して、グリッド上にプログラムを展開します。研究者が内部のアーキテクチャやトポロジを理解する必要をなくすことで、より多くの研究者が簡単にこれらの技術革新を利用できるようになります。また、新しいインターフェイスでは、ユーザ ベースに影響を与えずに変更することができます。開発は進行中で、フェーズ 3 は 2007 年後半から 2008 年前半にかけてキャンパスに導入される予定です。 技術の実装フェーズ 2 では、200 のノードを含む新しいクラスタによってキャンパス グリッドが拡大されました(図 1)。各ノードには 2 つのデュアルコア AMD プロセッサが含まれ、プロセッサの合計は 800 になります。InfiniBand サーバ ファブリックは、14 台の Cisco SFS 7000シリーズ InfiniBand サーバ スイッチを使用して構築されました(図 2)。スイッチングのコア レベルは、2 台の Cisco SFS 7008 InfiniBand サーバ スイッチを使用して、42 TB のストレージにすべてのプロセッサを接続します。 クラスタにおけるプロセッサからストレージへのスループットは現在 1.4 GB/sec で、将来の増強によって 2.5 GB/sec まで高速化できると期待されています。この桁外れのパフォーマンスは、大学とシスコの共同チームによって達成されました。これにより、前例のないスケールの InfiniBand ファブリック全体にパラレル ファイル システムを展開でき、関係するハードウェア コンポーネントの最高スループットに近いパフォーマンスが実現します。 Avery 氏は次のように述べています。「分散型のデータ モデルはシンプルで、コスト効率も高いです。科学者は巨大なファイル システムにアクセスできますが、それはデスクトップ上にあるかのように見え、ローカル ストレージと同程度の速度で動作します。1 つのデータセットを 1 か所に置いておくことも、任意のデスクトップにストリーム送信することもできます。データをコピーしたり、サブセットに分割したりする必要はありません。そして研究者は、チーム単独では決して購入できない巨大なストレージ グリッドを共有できます。」 歴史的に、物理学は常に大規模な共同研究が行われてきた分野でした。今とは比較にならないほど小さいデータ セットであっても、データ管理の問題によって研究の進め方が左右されました。最高レベルの困難を伴い、多数の研究者が関わるプロジェクトでは、データのホスティングを国の研究所に頼る必要がありました。すべてのデータにアクセスするためには、研究者は研究所まで出向く必要がありました。インターネットと高速ネットワークによって遠隔地での作業が可能になりましたが、作業効率では妥協が余儀なくされました。つまり、遠隔地の研究者はデータのサブセットで作業しなければならず、接続の遅延に対処する必要があります。 製品リストハイパフォーマンス コンピューティング ソリューション:
データ移動の要求から、ネットワーク、ストレージ、および CPU ファームの高速化が促進されました。フロリダ大学のキャンパス グリッドは、驚くべき速さでプロジェクトのスケールが拡大し続ける時期にきています。Avery 氏は次のように述べています。「物理学のように共同研究が盛んな分野では、前進の速度はサイバー インフラストラクチャに左右されます。シスコとの作業から、巨大なチームが力を発揮するために必要なネットワーキング能力を得ました。現在は、数百人から数千人の研究者が 1 つの実験とそれによって生じるデータ セットに集中する時代です。研究によって多くの企業が大きな影響を受け、今回の進歩は、私たちが成し遂げてきた進歩は今後何年にもわたって世界経済に直接影響を与えることでしょう。」 関連情報シスコ高性能コンピューティング ソリューションの詳細:http://www.cisco.com/web/JP/product/hs/snv |


