GPU カードの取り付け

この章は次のトピックで構成されています。

サーバ ファームウェアの要件

次の表に、サポートされている GPU カードのサーバ ファームウェアの最小バージョンを示します。

GPU カード

Cisco IMC/BIOS の必要な最小バージョン

NVIDIA L4 PCIe、72W、Gen 4 x8(UCSC-GPU-L4)

4.1(3)

Intel GPU Flex 140 PCIe、75W、Gen 4 x8(UCSC-GPU-FLEX140)

4.1(3)

GPU カードの構成規則

GPU カードを使用して、サーバを設定するときは、次の規則に注意してください。

  • サーバーは、次の GPU をサポートします。

    • NVIDIA L4 70W 24GB PCIe GPU(UCSC-GPU-L4):ハーフ ハイト、ハーフ レングス(HHHL)GPU シングル幅 GPU カード。この GPU は、PCIe Gen 4 または PCIe Gen 5 ハーフ ハイトまたはフルハイト ライザーのいずれかに取り付けることができます。各サーバーは、ハーフ ハイト (HH ライザー) で同じタイプの GPU を最大 3 つ、またはフル ハイト (FH) ライザーで同じタイプの GPU を最大 2 つサポートできます。

    • Intel GPU Flex 140 Gen4x8 75W PCIe(UCSC-GPU-FLEX140):ハーフハイト、ハーフ レングス(HHHL)GPU シングル幅 GPU カード。この GPU は、PCIe Gen4 または PCIe Gen5 ハーフハイト ライザーに取り付けることができます。各サーバーは、ハーフハイト(HH ライザー)の同じタイプの最大 3 つの GPU、またはフルハイト(FH)ライザーの同じタイプの最大 2 つの GPU をサポートできます。

  • PCIe スロット 1 および 2 に、最大 3 個のシングル幅 GPU カードを取り付けることができます。

  • GPU は、フルハイト PCIe ライザー 1 または 2(あるいはその両方)に取り付けることができます。

  • UCS 電力計算ツール(http://ucspowercalc.cisco.com)を使用し、サーバ構成に基づいて必要な電源を確認します。

  • サーバーに GPU カードを混在させることはできません。GPU の混合はサポートされていません。

  • CIMC および UCSM など Cisco 管理ツールでは固有の SBIOS ID が必要になるため、GPU カードはすべてシスコから購入してください。

  • 1 つ以上の GPU をサポートするには、サーバーに 2 つの CPU と 2 つのフルハイトの背面ライザーが必要です。

すべての GPU に関する要件:メモリマップド I/O 4 GB 以上

サポートされているすべての GPU カードで、4 GB 以上のメモリ マップド I/O(MMIO)を許可する BIOS 設定の有効化が必要です。

  • スタンドアロン サーバ:サーバをスタンドアロン モードで使用する場合、この BIOS 設定はデフォルトで有効です。

    [Advanced] > [PCI Configuration] > [Memory Mapped I/O Above 4 GB] を [Enabled] にする

    ブート中にメッセージが表示されたら、F2 キーを押して BIOS Setup ユーティリティに切り替えます。

  • サーバが Cisco UCS Manager と統合されてサービス プロファイルによって制御され、かつ GPU が存在する場合、この設定はサービス プロファイルでデフォルトで有効になっています。

    この設定を手動で変更するには、次の手順を実行します。

手順


ステップ 1

サービス プロファイルの設定方法については、以下からご使用のリリースの GUI または CLI の Cisco UCS Manager コンフィギュレーションガイドを参照してください。

Cisco UCS Manager コンフィギュレーション ガイド

ステップ 2

サーバ関連ポリシーの設定 > BIOS 設定の構成の章を参照してください。

ステップ 3

プロファイルの PCI 構成 BIOS 設定のセクションで、[Memory Mapped IO Above 4GB Config] を以下のいずれかに設定します。

  • [Disabled]:64 ビット PCI デバイスを 64 GB 以上のアドレス空間にマッピングしません。

  • Enabled:64 ビット PCI デバイスの I/O を 64 GB 以上のアドレス空間にマッピングします。

  • [Platform Default]:ポリシーで、サーバの BIOS デフォルト値に含まれるこの属性の値が使用されます。これは、この項目にデフォルトの [Enabled] 設定を使用するようにサーバ BIOS が設定されているとわかっている場合にのみ使用します。

ステップ 4

サーバをリブートします。

(注)  

 

Cisco UCS Manager は、BIOS ポリシーまたはデフォルトの BIOS 設定を通じて、Cisco Integrated Management Controller(CIMC)バッファに BIOS 設定の変更をプッシュします。これらの変更はバッファ内にとどまり、サーバがリブートされるまでは有効になりません。


シングル幅の GPU カードの交換

GPU キット(UCSC-GPURKIT-C220)は、シスコから入手できます。GPU 取り付けブラケットと次のライザー(ライザー 1 および 2)を含むキット。

  • 1 x16 PCIe Gen4 ライザー、標準 PCIe、Cisco VIC、フルハイト、長さ 3/4 をサポート

  • x16 PCIe Gen4 ライザー X 1、標準 PCIe、フルハイト、長さ 3/4

手順


ステップ 1

PCIe ライザから既存の GPU カードを取り外します。

  1. サーバのシャットダウンと電源切断の説明に従って、サーバをシャットダウンして電源を切ります。

  2. 上部カバーを取り外せるように、サーバをラックの前方に引き出します。場合によっては、リア パネルからケーブルを取り外して隙間を空ける必要があります。

    注意    

     
    コンポーネントへの接触や確認作業を安全に行えない場合は、ラックからサーバを取り出してください。
  3. 上部カバーの取り外しの説明に従ってサーバから上部カバーを取り外します。

  4. #2 のプラス ドライバを使用して非脱落型ねじを締めます。

  5. まっすぐ持ち上げて、マザーボードからライザーを外します。ライザーを上下逆にして静電気防止シートの上に置きます。

  6. GPU カードの両端を均等に引いて、ソケットからカードを外します。

    ライザーにカードがない場合は、ライザーの背面の開口部からブランク パネルを取り外します。

ステップ 2

GPU をそのまま持ち、PCIe ライザーのソケットから引き出します。

ステップ 3

新しい GPU カードを取り付けます。

(注)  

 

Intel Flex 140 および NVIDIA L4 はハーフハイトのハーフレングス カードです。1 個がフル高 PCIe スロット 1 に取り付けられている場合は、カードにフル高の背面パネル タブが取り付けられている必要があります。

  1. 新しい GPU カードを PCIe ライザーの空のソケットに合わせ、両端を保持クリップにスライドさせます。

  2. カードの両端を均等に押して、ソケットにしっかりと装着します。

  3. カードの背面パネル タブが、ライザーの背面パネルの開口部に対して水平になっていることを確認します。

    図 1. PCIe ライザー アセンブリ、3 HHHL

    (注)  

     

    簡単に識別できるように、各ライザー ケージの上部にある板金にライザー番号が刻印されています。

    1

    PCIe スロット 1 の脱落防止機構付きねじ(位置合わせ機能)

    PCIe スロット 1 の背面パネルの開口部

    6

    PCIe スロット 3 ライザーのハンドル

    2

    PCIe スロット 2 の脱落防止機構付きねじ(位置合わせ機能)

    7

    PCIe スロット 1 の背面パネルの開口部

    3

    PCIe スロット 2 の脱落防止機構付きねじ(位置合わせ機能)

    8

    PCIe スロット 2 の背面パネルの開口部

    4

    PCIe スロット 1 ライザーのハンドル

    9

    PCIe スロット 3 の背面パネル開口部

    5

    PCIe スロット 2 ライザーのハンドル

    -
    図 2. PCIe ライザー アセンブリ、2 FHFL

    1

    PCIe スロット 1 の脱落防止機構付きねじ

    4

    PCIe スロット 2 ライザーのハンドル

    2

    PCIe スロット 2 の脱落防止機構付きねじ

    5

    PCIe スロット 1 の背面パネルの開口部

    3

    PCIe スロット 1 ライザーのハンドル

    -

    PCIe スロット 2 の背面パネル開口部

  4. PCIe ライザーを、マザーボード上のソケットとシャーシの位置合わせチャネルの上に配置します。

    図 3. PCIe ライザーの位置合わせ機構
    • 以下に示すように、3 つの HHHL ライザーを備えたサーバーの場合、3 つのソケットと 3 つの位置合わせ機能を使用できます。

      1

      シャーシのライザーの位置合わせ機能(非脱落型ねじ)

      シャーシのライザーの位置合わせ機能(非脱落型ねじ)

    • 以下に示すように、2 つの FHFL ライザーを備えたサーバーの場合、2 つのソケットと 2 つの位置合わせ機能を使用できます。

    図 4. PCIe ライザーの位置合わせ機構

    1

    ライザー ハンドル

    2

    シャーシのライザーの位置合わせ機能(非脱落型ねじ)

  5. PCIe ライザーの両端を慎重に押し下げて、2 つのコネクタをマザーボード上の 2 つのソケットにしっかりと差し込みます。

  6. ライザーが水平になり、完全に装着されたら、#2 プラス ドライバーを使用してライザーをサーバー シャーシに固定します。

  7. 上部カバーをサーバに再度取り付けます。

  8. サーバをラックの元の位置に戻し、ケーブルを再度接続したら、電源ボタンを押してサーバの電源を入れます。

ステップ 4

オプション:GPU カードをサポートするドライバのインストールに進みます。


GPU カードをサポートするドライバのインストール

ハードウェアの取り付け後、サーバ BIOS を適切なレベルに更新し、ドライバなどのソフトウェアを次の順序でインストールする必要があります。

  1. サーバ BIOS を更新します。

  2. GPU ドライバを更新します。

1. サーバ BIOS の更新

Host Upgrade Utility を使用して、最新の Cisco UCS C240 M4 サーバ BIOS を Cisco UCS C240 M4 サーバにインストールします。


(注)  


NVIDIA ドライバを更新する前に、次の手順を実行する必要があります。


手順


ステップ 1

http://www.cisco.com/cisco/software/navigator.html にアクセスします。

ステップ 2

中央の列の [サーバ - ユニファイドコンピューティング(Servers - Unified Computing)] をクリックします。

ステップ 3

右側の列の [Cisco UCS C シリーズラックマウントスタンドアロンサーバソフトウェア(UCS C-Series Rack-Mount Standalone Server Software)] をクリックします。

ステップ 4

右側のカラムでお使いのサーバのモデルの名前をクリックします。

ステップ 5

[Unified Computing System(UCS)サーバソフトウェア(Unified Computing System (UCS) Server Firmware)] をクリックします。

ステップ 6

リリース番号をクリックします。

ステップ 7

[今すぐダウンロード(Download Now)] をクリックして ucs-server platform-huu-version_number.iso ファイルをダウンロードします。

ステップ 8

次のページで情報を確認した後、[ダウンロードを続行する(Proceed With Download)] をクリックします。

ステップ 9

次の画面に進んでライセンス契約に同意し、このファイルを保存する場所を参照します。

ステップ 10

サーバ BIOS を更新するには、Host Upgrade Utility を使用します。

Host Upgrade Utility のユーザ ガイドは、『Utility User Guides』を参照してください。


2. GPU カード ドライバの更新

サーバ BIOS を更新したら、ハイパーバイザ仮想マシンに GPU ドライバをインストールできます。

手順


ステップ 1

コンピュータにハイパーバイザ ソフトウェアをインストールします。インストール手順については、ハイパーバイザのマニュアルを参照してください。

ステップ 2

ハイパーバイザ内で仮想マシンを作成します。手順については、ハイパーバイザのマニュアルを参照してください。

ステップ 3

仮想マシンに GPU ドライバをインストールします。ドライバを次のいずれかのサイトからダウンロードします。

ステップ 4

サーバを再起動します。

ステップ 5

仮想マシンが GPU カードを認識できることを確認します。Windows では、[デバイス マネージャー(Device Manager)] の [ディスプレイ アダプター(Display Adapters)] から確認します。