Guest

エンタープライズ データセンター

大学がグリッド コンピューティングと高速ネットワーキングを開拓

ユーザ事例





大学がグリッド コンピューティングと高速ネットワーキングを開拓


フロリダ大学の共同研究における計算およびネットワーク スループットで 100 倍増を実現

概要




フロリダ大学、高性能コンピューティング センターおよびキャンパス グリッド プロジェクト
  • 業種:高等教育
  • 所在地:フロリダ州ゲインズビル




ビジネス上の課題

  • 計算を高速化し、共同研究から得られる結果の精度を高める
  • 包括的な最先端のソリューションを合理的な費用で構築するために設計および実装で協力する
  • 全世界の研究教育コミュニティにおける大学の競争力強化につながる一流の設備を提供する




ネットワーク ソリューション

  • フェーズ 1:高速接続を実現するシスコ サーバ ファブリック スイッチを使用した演算グリッド
  • フェーズ 2:グリッド規模の拡大と、高速キャンパス ネットワークおよびキャンパス外研究ネットワークとのリンクの導入
  • HPC 環境向けの新しいソリューションの調査と開発を目的とした、フロリダ大学のテクノロジー リーダーとシスコのエンジニアリングによる共同研究の継続




ビジネス上の効果

  • シミュレーション時間の短縮:キャンパス内の計算能力およびネットワーク スループットの 100 倍増
  • 共有 HPC グリッドとネットワークを利用できる研究者の基盤の拡大
  • HPC センターによる計算リソースの統合と集中管理
  • オープン サイエンス グリッド(OSG)への関与を強化する先進設備


ビジネス上の課題

研究教育(R&E:Research and Education)コミュニティは、高性能コンピューティング(HPC)およびネットワーキングを利用するだけでなく、これらに必要な基礎テクノロジーの進歩にも貢献しています。伝統的に、研究チームはそれぞれが独自のインフラストラクチャを設計、展開、および運用していました。ただし、このようなリソースのサイロ化によって、研究者や教育者の関心がコンピュータに向けられ、実業であるはずの研究に集中できなくなっていました。また、システムとネットワークが複雑になるにつれて、サポートと費用の問題も大きくなってきました。その結果、大学の情報技術(IT)チームが果たす役割は大きくなっています。

フロリダ大学 CIO、Marc Hoit 氏は次のように述べています。「フロリダ大学で HPC リソースを調整するための努力は何年も前に始まり、HPC 委員会から HPC センターへと発展しました。チームおよび学部間でリソースを調整することは、IT にとって大きな意味がありました。無駄な労力を費やさず、共通の要件を識別し、個別に存在していたクラスタやネットワークの能力を大幅に超えたインフラストラクチャを提供することができました。」

キャンパスに存在する組織間の壁を乗り越えるために HPC センターの設立が進められていた頃、物理学部では共有コンピューティング グリッドと高速接続への要求が高まっていました。フロリダ大学物理学部の科学者、Paul Avery 氏は次のように述べています。「シミュレーションは科学研究の重要な位置を占めています。物理学コミュニティの中で、私たちはかなり長い間共有コンピューティングに利用していましたが、今は化学、生物学、医学、地学といった他の多くの分野が演算グリッドと高速ネットワークを使用して、これまでは年単位だったシミュレーション時間を週単位に短縮しています。」

教授陣による地道な努力が結集され、IT と経営陣のサポートを得て、キャンパス規模のグリッド コンピューティングの次世代モデルへの移行に向けて動き出しました。具体的な要件として、大規模シミュレーションで求められる計算能力とデータ移動のソリューションがありました。さらに、全国的および国際的な R&E コミュニティに拡大する共同研究プロジェクトを推し進めるために、キャンパス ネットワークとデータ移動のソリューションを全国的なネットワークに組み入れる必要があります。

 

「シスコとのパートナーシップは不可欠です。(中略)キャンパス内の機能は 2 桁増強され、共同研究で得られた成果は、将来の世代の商業利用可能なソリューションをよりよいものにするために役立てられます。」
- フロリダ大学 HPC センター長 Erik Deumens 氏

ネットワーク ソリューション

フロリダ大学のキャンパス グリッド コンピューティング イニシアティブは、以下のように段階的に実行されました。

  • フェーズ 1 - 物理学部内の総合的なグリッド研究。共有コンピューティング モデルの初めに必要だったのは、物理学部、教養学部、および CIO から成る学部横断の資金調達でした。これらの資金源と国際バーチャル データ グリッド研究所(iVDGL)プロジェクトによってサポートされたクラスタが、フェーズ 1 で展開されました。
  • フェーズ 2 - 工学部。最初の HPC クラスタ展開の成功は、工学部、総務課、および CIO からの追加資金調達を促し、工学系学部全体の共有リソースとして、InfiniBand とギガビット イーサネットの両方で接続された、さらに規模の大きい 2 つ目のクラスタを実現することができました。このフェーズでは、高速ネットワーキング イニシアティブでグリッド コンピューティング ソリューションを補強するという 2 つ目の学部主導のイニシアティブが加わり、さらに、必要なネットワーキング インフラストラクチャに資金を供給するために全米科学財団(NSF)に助成金を申請しました。


NSF の助成金の獲得はフェーズ 2 にとってきわめて重要でしたが、追加のサポートを得るにはプロジェクトの全面的な成功が必要でした。フロリダ大学は、ネットワーキング パートナーであるシスコとともに、クラスタのサーバ ファブリックの相互接続の設計、展開、および研究、ならびに高速クラスタ間接続およびフロリダ ラムダレール(FLR)とナショナル ラムダレール(NLR)への接続に投資するために、共同研究プロジェクトに加わりました。シスコと大学の間に築かれた長年の関係と、キャンパス内および FLR と NLR インフラストラクチャ内の両方における今までのシスコ ネットワーキング ソリューションの展開を背景に、共同プロジェクトはインフラストラクチャをうまく活用して、今までに例のない信頼性、処理能力、およびパフォーマンスを備えたソリューションを導入しました。

フロリダ大学 HPC センター長 Erik Deumens 氏は次のように述べています。「シスコとのパートナーシップは不可欠です。HPC とデータ管理における当大学の専門家と、シスコで最良のネットワーキング アーキテクトおよびエンジニアが連携することによって、通常では得られないような成果を達成できました。そのことを誇らしく思います。キャンパス内の機能は 2 桁増強され、共同研究で得られた成果は、将来の世代の商業利用可能なソリューションをよりよいものにするために役立てられます。」

Hoit 氏は次のように述べています。「多くの会社から私たちと組みたいという申し出がありますが、彼らの目的は製品を売りつけることです。シスコとは、真のパートナーシップを築いています。私たちは資金とリソースを注ぎ込んで、大規模演算グリッド内での最新テクノロジーについて、新しい研究ソリューションと潜在的な使用に関する知識を得ました。」

フロリダ大学のキャンパス グリッド コンピューティング イニシアティブが提供するプラットフォームから、研究者はオープン サイエンス グリッド(OSG)に参加できます。OSG は共有インフラストラクチャを共同で展開および所有するメンバーから成る関連コンソーシアムで、米国、南米、およびアジアの約 40 か所に拠点があります。高速ネットワークは現在 20,000 以上のプロセッサを接続し、さまざまな科学の分野に共同のプラットフォームを提供しています。メンバーは、単体では実現不可能なインフラストラクチャにアクセスできます。フロリダ大学とそのパートナーとしてのシスコは、生産と科学分野での研究プロジェクトの両方のために OSG を使用して、新しいグリッド テクノロジーをテストできます。

 

「新しいグリッド インフラストラクチャ、そして他の高速 R&E ネットワークとの接続により、コミュニティ全体における当大学の e-Science の地位は大幅に強化されました。シスコとの作業を通じて、よりよいソリューションを設計して構築する方法を学びました。」
- フロリダ大学最高情報責任者 Marc Hoit 氏

ビジネス上の効果

フェーズ 2 が完了した時点で、大学は共同研究チームがより多くの計算能力にアクセスできるようにすると同時に、キャンパス内外のクラスタ リソース間で非常に大量のデータ セットを移動できるようにしました。新しい計算、ストレージ、およびネットワーキングの機能は、さまざまな共同研究プロジェクトに以下のような大きな好影響をもたらします。

  • キャンパス グリッド内の何百ものプロセッサへのアクセスを研究者に与えることにより、大規模な問題に取り組む能力。このプロジェクト以前は、1 つの研究者グループがシミュレーションを実行した場合に、クラスタに多大な負荷をかけることは避けられませんでした。他のチームがその影響を受けるという理由で、そのグループはシミュレーションを実行できませんでした。新しい設備があれば、このグループはシミュレーションを実行でき、結果は数分で得られます。1 時間ほどで大量の結果を得ることができるのです。
  • 最も複雑なコードの処理時間の短縮。プロジェクト チームは数週間から数か月の時間を節約でき、多くの生命に影響を及ぼす結果を得るまでの時間が短縮されました。たとえば、あるプロジェクトは狂牛病やアルツハイマー病など、タンパク質の折りたたみの誤りに起因する病気への取り組みに参加しています。病気を理解し、突破口発見の可能性を探るために、チームはタンパク質の折りたたみのシミュレーションを行う必要があります。タンパク質の 1 回の折りたたみシミュレーションは現在、10 週以下で完了できますが、以前利用していた計算プラットフォームで同じシミュレーションを実行した場合は 1 年以上かかります。
  • 最も複雑な HPC システムを購入できる少数の研究チームだけでなく、より多くの研究チームによるアクセス。
  • 使いやすくするための進歩の継続。クラスタとグリッド コンピューティングを開拓したコンピュータ専門家だけでなく、より多くの科学者がこのテクノロジーにアクセスできるようにします。


Hoit 氏は次のように述べています。「キャンパス グリッド コンピューティングとネットワーキング イニシアティブの価値は、研究者と大学全体に直接的な影響を及ぼしています。大学は、研究者と資金を求める競争を強いられています。新しいグリッド インフラストラクチャ、そして他の高速 R&E ネットワークとの接続により、コミュニティ全体における当大学の e-Science の地位は大幅に強化されました。インフラストラクチャは研究プログラムを豊かにすると同時に、HPC およびストレージにおける当大学のリーダーシップを強調することになります。シスコとの作業を通じて、よりよいソリューションを設計して構築する方法を学びました。私たちは、リーダーであり続けるために、どこで資金を節約でき、どこに資金を注ぎ込む必要があるかを理解しています。」

高速グリッドを利用することで、研究者の作業方法が変わりつつあります。以前は、データ移動がボトルネックでした。科学者は、必要なデータ セットが管理可能になるまで問題の単純化を何度も繰り返していました。今では、データ セットは数百テラバイト、さらにはペタバイト単位にまで容易に拡大することができます。キャンパス内グリッドと、より大きい OSG および国内の他の計算リソースへの高速接続によるアクセスにより、完全な状態のデータセットを使用して問題に取り組むことと、共同作業を行うチーム間で大きいデータ セットを共有して、複数の視点や並行的なアプローチを適用することが可能になります。

Avery 氏は次のように述べています。「私たちの行動の 3 分の 2 は社会的なものです。他の研究者との連携は非常に重要です。ネットワークはコミュニケーションを促進します。ビデオ会議などのリアルタイム形式で情報を中継することができます。高速キャンパス ネットワークにおける最新の進歩は、非常に大きなサイズのデータも別の場所に移動できることです。データの移動が可能であれば、データを理解して問題を解決するために必要な、より多くの専門知識を集めることができます。この状態は医学の分野ではすでに進行しており、医者が国内の別の医者に約500 M バイトの医学画像を送信できます。この種の便利なコラボレーションを分子研究、環境の研究、または物質の起源の発見に適用することで、科学のさまざまな分野で革命的な進歩のドアを開いてきました。」

 

「物理学のように共同研究が盛んな分野では、研究の進捗がサイバー インフラストラクチャに左右されます。シスコとの作業から、巨大なチームが力を発揮するために必要なネットワーキング能力を得ました。(中略)今回の進歩は、今後何年にもわたって世界経済に直接影響を与えることでしょう。」
- フロリダ大学教養学部物理学科物理学者 Paul Avery 氏

次のステップ

フェーズ 3 では、グリッド コンピューティングおよびネットワーキングの設備を健康科学センターと生命科学部で利用できるようになります。これらのチームは、コンピュータへの依存度は低いものの、Web 形式のインターフェイスを使用して、グリッド上にプログラムを展開します。研究者が内部のアーキテクチャやトポロジを理解する必要をなくすことで、より多くの研究者が簡単にこれらの技術革新を利用できるようになります。また、新しいインターフェイスでは、ユーザ ベースに影響を与えずに変更することができます。開発は進行中で、フェーズ 3 は 2007 年後半から 2008 年前半にかけてキャンパスに導入される予定です。

技術の実装

図 1 フェーズ 1 および 2 のキャンパス グリッド

図 1 フェーズ 1 および 2 のキャンパス グリッド
※画像をクリックすると、大きな画面で表示されますpopup_icon

フェーズ 2 では、200 のノードを含む新しいクラスタによってキャンパス グリッドが拡大されました(図 1)。各ノードには 2 つのデュアルコア AMD プロセッサが含まれ、プロセッサの合計は 800 になります。InfiniBand サーバ ファブリックは、14 台の Cisco SFS 7000シリーズ InfiniBand サーバ スイッチを使用して構築されました(図 2)。スイッチングのコア レベルは、2 台の Cisco SFS 7008 InfiniBand サーバ スイッチを使用して、42 TB のストレージにすべてのプロセッサを接続します。

図 2 高速接続

図 2 高速接続
※画像をクリックすると、大きな画面で表示されますpopup_icon

クラスタにおけるプロセッサからストレージへのスループットは現在 1.4 GB/sec で、将来の増強によって 2.5 GB/sec まで高速化できると期待されています。この桁外れのパフォーマンスは、大学とシスコの共同チームによって達成されました。これにより、前例のないスケールの InfiniBand ファブリック全体にパラレル ファイル システムを展開でき、関係するハードウェア コンポーネントの最高スループットに近いパフォーマンスが実現します。

Avery 氏は次のように述べています。「分散型のデータ モデルはシンプルで、コスト効率も高いです。科学者は巨大なファイル システムにアクセスできますが、それはデスクトップ上にあるかのように見え、ローカル ストレージと同程度の速度で動作します。1 つのデータセットを 1 か所に置いておくことも、任意のデスクトップにストリーム送信することもできます。データをコピーしたり、サブセットに分割したりする必要はありません。そして研究者は、チーム単独では決して購入できない巨大なストレージ グリッドを共有できます。」

歴史的に、物理学は常に大規模な共同研究が行われてきた分野でした。今とは比較にならないほど小さいデータ セットであっても、データ管理の問題によって研究の進め方が左右されました。最高レベルの困難を伴い、多数の研究者が関わるプロジェクトでは、データのホスティングを国の研究所に頼る必要がありました。すべてのデータにアクセスするためには、研究者は研究所まで出向く必要がありました。インターネットと高速ネットワークによって遠隔地での作業が可能になりましたが、作業効率では妥協が余儀なくされました。つまり、遠隔地の研究者はデータのサブセットで作業しなければならず、接続の遅延に対処する必要があります。

製品リスト




ハイパフォーマンス コンピューティング ソリューション:

  • Cisco SFS 7008 InfiniBand サーバ スイッチ
  • Cisco SFS 3012 マルチファブリック サーバ ゲートウェイ
  • Cisco Catalyst 6500 シリーズ スイッチ
  • Cisco MDS 9000 ストレージ ファブリック スイッチ
  • Cisco 7600 シリーズ ルータ


データ移動の要求から、ネットワーク、ストレージ、および CPU ファームの高速化が促進されました。フロリダ大学のキャンパス グリッドは、驚くべき速さでプロジェクトのスケールが拡大し続ける時期にきています。Avery 氏は次のように述べています。「物理学のように共同研究が盛んな分野では、前進の速度はサイバー インフラストラクチャに左右されます。シスコとの作業から、巨大なチームが力を発揮するために必要なネットワーキング能力を得ました。現在は、数百人から数千人の研究者が 1 つの実験とそれによって生じるデータ セットに集中する時代です。研究によって多くの企業が大きな影響を受け、今回の進歩は、私たちが成し遂げてきた進歩は今後何年にもわたって世界経済に直接影響を与えることでしょう。」

関連情報

シスコ高性能コンピューティング ソリューションの詳細:http://www.cisco.com/web/JP/product/hs/snv

 
LP Chat Example Page old