データセンター

Cisco Unified Computing System での電力管理:統合型アプローチ

ホワイトペーパー





Cisco Unified Computing System での電力管理: 統合型アプローチ



このドキュメントの内容


データセンターの構築と運用において、電力の効率利用と冷却への取り組みは、当初は補助的に対応されていましたが、この 10 年の間に主要な課題へと変わってきました。業界関係者は、個々のチップの効率から、システム設計、さらにはデータセンターの効率的な冷却に至るまで、電力および冷却に関連するほぼすべての要素の効率を改善してきました。現在、ユーザは、ワット当たりのスループットに関して、これまでで最も効率的な設計のサーバを購入することができ、新しいデータセンターの設計は 10 年前と比較して大幅に改善されています。

システムの最大の弱点は、依然としてシステム、ラックレベル、ローレベルでの電力管理であり、これらの箇所では非常に大きな電力が消費されています。単一シャーシ内での電力管理はできても、ラックレベルおよびローレベルでの電力管理、特に電力ピーク時に柔軟な管理が要求されるケースに対し、包括的かつ使用可能なソリューションを提供しているシステムベンダーは、これまでほとんどありませんでした。Cisco Unified Computing System™ は、この課題を解決する初のソリューションです。

Cisco Unified Computing System では、Cisco® UCS のシャーシおよびラックのグループ間での電力管理機能を実現しており、追加の導入コストをかけずに、旧来のデータセンターと比較してスループットを最大 30% 改善できるようにします。この機能は、Cisco UCS のアーキテクチャに統合されています。

このドキュメントでは、次のトピックについて説明します。

  • パワー キャッピングの概要およびパワー キャッピングが選ばれる理由
  • パワー キャッピングが、限られた実装では何年も前から利用可能であったにもかかわらず、ほとんど使用されてこなかった理由
  • Cisco Unified Computing System が電力管理の問題を解決するしくみ

複数の場所での節電:すべてが等しいとは限らない


電力管理とキャッピングについて考察する前に、シスコの取り組みの背景について説明します。ワークロード単位あたりの消費電力を削減するという基本的な目標は、何年もの間、多くのベンダーの努力の対象となっており、コンピュータ システム内だけでなくデータセンター内でもいたるところで革新が起こっています。電力および冷却に関連する要素には、シスコなどのシステム ベンダーの範囲を超えているものがあります。同時に、システムの範囲の中にも電力および冷却の効率を改善する可能性が複数存在します。1図 1 に、サーバおよびシャーシのレベルでの消費電力を削減するために、Cisco Unified Computing System が実装したテクノロジーを示します。2

図 1 Cisco UCS の電力および冷却のテクノロジー

図 1 Cisco UCS の電力および冷却のテクノロジー
※画像をクリックすると、大きな画面で表示されますpopup_icon

図 1 に示されている、電源装置、Voltage Regulator Module(VRM; 電圧調整モジュール)、CPU、メモリ、ファンなど、一部のテクノロジーはすべてのベンダーで対応できるものであり、シスコでもこれらのテクノロジーを活用してきましたが、実際にこれらの分野においてはベンダーとの差はごくわずかです。3しかし、全体の冷却およびエアーフローのアーキテクチャや、システム モジュール間でのアクティブな電力管理など、電力管理の他の側面における革新では、シスコが大きな成果をもたらしており、シスコが価値を与えている分野といえます。

パワー キャッピングとは


パワー キャッピングは、Cisco Unified Computing System の主要な差別化要因の 1 つです。この機能により、個々の Cisco UCS インスタンスの規模で利益が増大します。パワー キャッピングとは、システム(ブレード サーバまたはラック サーバ)の消費電力を、システムの最大定格電力以下のしきい値に制限する機能です。

たとえば、ブレード サーバの最大電力定格が 340 ワット(W)であり、使用可能な電力が 3334W AC しかない場合、つまりブレード 1 台あたり(Cisco UCS シャーシの場合はシャーシを追加)平均 300W を供給すれば十分である場合、ブレード 1 台あたり最大 300W にキャッピングすることにより、電源装置の容量を超えないようにすることができます。このタイプのキャッピングは、静的パワー キャッピングと呼ばれています。静的パワー キャッピングは、許可したよりも多い電力がシャーシに供給されないようにできますが、各種ブレードのロードが変動する可能性があること、また任意の時点であるブレードでは割り当てられた電力を完全に使用しておらず、他のブレードがより多い電力を要求する可能性があることを考慮していません。

キャッピングのもう 1 つのタイプである動的パワー キャッピングでは、電源管理システムがシャーシ内の複数のブレードに電力プールの合計を割り当てることができます。動的パワーキャッピングを使用すると、システム全体を特定の電力バジェットに準拠させると同時に、ロードが高くなり電力を追加する必要があるブレードに電力を向けることが可能になります。

これまで、市販の動的パワー キャッピング製品は、前述のとおり、単一のブレード シャーシまたは管理された電源ドメインとしての シャーシに限られていました。次のセクションでは、シスコが動的パワー キャッピングを複数のブレード シャーシに拡張し、従来の他社製品よりも運用管理しやすい形で実装した方法について説明します。

パワー キャッピングを使用する理由


パワー キャッピングの重要性を理解するにあたって、最初のステップは、データセンターの構築と運用で実際にコストがかかる分野を見ることです。データセンター業界以外では、多くの人がデータセンターでは土地や建物などのスペースに関連する分野で最もコストがかかると考えています。この考えに基づき、顧客もベンダーも、1 ラックユニット(1RU)のサーバおよびブレードのソリューションを使用してコンピューティング密度を増加させる、つまり同じフロア スペースにより多くのものを単に詰め込むことが、データセンターの最大のコスト要因の削減につながると考えています。

10 年前はスペースが主なコスト要因でしたが、より規模の大きいデータセンターがオンラインになり、データセンターで最もコストがかかるのは、実際には電源および冷却装置のインフラストラクチャであることが明らかになりました(図 2)。

図 2 データセンターにおける導入コストの要素

図 2 データセンターにおける導入コストの要素
※画像をクリックすると、大きな画面で表示されますpopup_icon

出典: Microsoft、C. Belady and G. Balakrishnan、『Incenting the Right Behaviors in the Data Center』(http://events.energetics.com/datacenters08/pdfs/Belady_Microsoft.pdf


コスト メトリックを見ると、全体の電力を削減するか、消費電力設計の範囲内でより多くの処理を行うことが、データセンターの導入コストを削減する最も効率的な方法であることが一目でわかります。4

運用コストに関しては(減価償却を含む)、データセンターのサーバが単体での最大支出である一方、電力インフラストラクチャとサーバの電力を合わせたコストが、大規模なデータセンターにおける次に高い運用コストを構成しています。図 3 および 4 に、データセンターの運用コストの詳細を示します。

図 3 データセンターの消費電力の分析

図 3 データセンターの消費電力の分析


図 4 データセンターにおけるインフラストラクチャ コンポーネントの運用コスト要因

図 4 データセンターにおけるインフラストラクチャ コンポーネントの運用コスト要因
※画像をクリックすると、大きな画面で表示されますpopup_icon

出典:James Hamilton(http://perspectives.mvdirona.com/2010/09/18/OverallDataCenterCosts.aspx)


電力のプロビジョニング:非効率的な割り当てにおける課題


電力は主な導入および運用コストの要素になっていますが、従来のデータセンターにおける電力は、これまで非効率的にプロビジョニングされ割り当てられてきました。設備の設計者は、ネームプレート定格へのプロビジョニングを行うという段階を経て、実際の消費電力の予測に基づいてプロビジョニングすることを習得していますが、必要な回路またはシャーシなど細かい部分での消費電力をインテリジェントに管理することができないため、図 5 に示すように、近年のデータセンターでは停留している電力量がかなり多くなっています。

図 5 データセンターの電力の非効率的な割り当て

図 5 データセンターの電力の非効率的な割り当て

見解:http://loosebolts.wordpress.com/2009/06/02/chiller-side-cha


電力に関連するコストが導入コスト(CapEx)の主な部分を占めているとすれば、これが運用コスト(OpEx)にも大きく影響し、そのプロビジョニングと管理は他に比べて非効率であることを考慮すると、今日のデータセンターには電力使用の最適化が必要であることが分かります。5

データセンターの効率性は、電力使用効率(PUE)によって評価されます。PUE はデータセンター設備の消費電力の合計を IT 機器の消費電力で割った値です。従来のデータセンターでは PUE 定格が 2 以上でしたが、新しく構築する場合の現在の目標は約 1.5 以下です。しかしながら、PUE に影響を及ぼす要因の多くは、サーバ設計の範囲外にあります。これは、本質的に拡張可能な管理フレームワークを持ち、今日の従来型サーバと比較して、将来の統合型データセンター管理スキームにより簡単に適応できる、Cisco Unified Computing System などのアーキテクチャであっても同様です。

データセンターにおける電力使用の最適化に影響を及ぼす 3 つの主な変数を次に示します。

  • 冷却および配電システムの効率:前述の図 3 で、システム冷却のコストが、ワークロードの実行に使用されるエネルギー コストの大きな割合を占めることがわかります。
  • 効率:総合的な PUE はサーバ 設計者の範囲外なので、サーバ設計が変更できる主なパラメータは、ワットあたりの処理効率です。このパラメータは 2 つの要因の影響を大きく受けます。1 つはシングル サーバ ノードが標準化されたさまざまなベンチマークによる評価どおりにどの程度効率的に実行できるかで、もう 1 つはブレード シャーシ内のファンや電源装置などの共有インフラストラクチャにかかるコストです。
  • 容量の利用効率:利用効率は、まさにパワー キャッピングが本領を発揮するところです。サーバ全体に対してインテリジェントに電力を割り当てる機能により、配電装置からシステムの電源装置を介してオーバー プロビジョニングする量を削減させ、全体の効率を向上させます。このドキュメントで後述するように、十分設計されたパワー キャッピング スキームで要求される電力量と、そのようなスキームを持たないシステムで要求される電力量とでは、その差は 100% に近くにもなります。

効率に対する考慮だけではなく、パワー キャッピングの重要な運用面、特に回路保護についても考慮する必要があります。IT ユーザおよびサーバ管理者にとってはサーバ単位およびシャーシ単位の電力量が懸念材料になりがちですが、IT 運用で配慮しなければいけないことは、回路6単位での総電力と、回路ブレーカが落ちないようにすることです。7

電力および冷却の容量の使用を最適化するには、データセンターにおける実際の電力使用を理解する必要があります。多くの企業のデータセンターでは、大半のサーバがほとんどの時間アイドル状態であり、電力ロードがフルになることはありません。したがって、飛行機が全席埋まることはないという現実のもと、航空会社が座席を過剰に売るのと同じ考えで、データセンターのすべてのワークロードと電力ロードが同時にフルになる機会は事実上なく、100% の容量に達しても大半のワークロードでは最大電力を消費しないと仮定することができます。このように、より多くのコンピューティング リソースを使用できるように、データセンターは使用可能な電力を過剰に確保することができます。

しかし、比較的予測可能な従来のデータセンターの電力モデルは、よりスケーラブルな Web 関連のワークロードの結果、変化しています。エンタープライズ アプリケーションを混在して実行する従来のデータセンターでは、すべてのサーバのロードが最大に達することは統計的にほとんどありません。しかし、ユーザが次第に大規模な Web 関連のアプリケーションを実装するにつれ、突然のトラフィック変動のために電力スパイクが発生する可能性が高くなっています。このようなワークロード スパイクが発生すると、何らかの方法でロードを制限して電力を管理できるメカニズムが実装されていない場合、データセンターは簡単にシャットダウンしてしまう可能性があります。従来の環境と比較して、消費電力が幅広く変化する可能性があることにより、電力割り当てを過剰に確保し、停留している電力量の一部を再キャプチャするという試みが複雑になります。

この容量の過剰確保を実際に適用するために、必要な技術的な機能を提供するパワー キャッピングなどの新しいテクノロジーが導入されています。しかし、このスキームを効率的に実装するには、単純にテクノロジーを利用可能にするだけでは不十分です。パワー キャッピング テクノロジーを IT ガバナンス プロセスに統合することも必要です。8

パワー キャッピングが使用されてこなかった理由


静的パワー キャッピングは基本的なテクノロジーであり、何年も前から利用可能であったにもかかわらず、現在、静的または動的なパワー キャッピングのどちらも普及していません。これにはいくつかの理由がありますが、主な理由の 1 つは、電力上限の実装に関して、主要関係者の目的と優先順位が競合していることに関係しています。主な関係者の視点を次に示します。

  • ビジネス エンド ユーザおよびアプリケーションの所有者:目的は、アプリケーションが常に最低限のコストで最高のパフォーマンスを実現することです。大半の場合、IT 運用の詳細は可視化されていません。ユーザを教育するために必要なガバナンスの変更は、リソースの使用に関するコミュニケーション向上と、何らかの形式のチャージバックを組み合わせ、事業部門で必要なレベルのパフォーマンスと可用性を提供するための真のコストを理解できるようにすることです。多くの場合、適切な教育を行うことで、有効なパワー キャッピングが Service Level Agreement(SLA; サービス レベル契約)の脅威にはならないことを理解してもらうことができます。

    さらに、多くの組織ではすでにビジネスに不可欠なアプリケーションと重要ではないアプリケーションの概念が適用されています。IT 管理者は、パワー キャッピングを考察する際に、アプリケーションの優先順位を定義し、その情報を使用することをビジネス オーナーに尋ねるようにしてください。アプリケーションの分類は異なるチャージバックによる差別化の基盤でもあります。ユーザが不可欠なアプリケーションにより多くのコストを支払うのは妥当なことです。
  • 設備管理者およびデータセンター管理者:主な目的は設備を保護することです。パワー キャッピングなどのテクノロジーが失敗すると、電力上限を超えたサーバのグループが原因で回路ブレーカが落ち、停電が発生したり、最悪の場合、ワークロードが転送された他のサーバで連鎖的に障害が発生し、ブレーカが遮断したりする可能性があります。9 電力、冷却、フロア スペースのリソースなどの制約内でデータセンターの容量を増加するといった別の目的は、中断のない運用に比べれば優先順位は下げられます。これらの管理者には、パワー キャッピングが設備のリスクを低減し、他の利点に勝る、揺るぎない信頼性を得ることができることを示す必要があります。
  • IT 幹部:これらの関係者は、設備の機能に対するアプリケーション ユーザの要望とニーズのバランスを取り、データセンターの最高の投資収益率を実現する必要があります。意思決定を支援するためにコストにフォーカスした適切なメトリックを使用することにより、上級の IT 管理者は強力なエージェントとなって、もともと保守的な運用管理者を転向させ、バランスを取ることができます。

パワー キャッピングを使用するその他の要因には、ツールと複雑性があります。通常、IT、設備、およびアプリケーションの管理グループは異なるツールを所有していており、共通のデータを通信または共有することができないため、統合されたモニタリング、レポート、イベント相関、応答戦略の実装が困難になっています10

このように一般的なツールセットがないため、電力上限の設定が重要で時間のかかる作業となっています。上限を低く設定しすぎると、上限を設定したサーバでのワークロードのパフォーマンスに大きく影響するため、特定のサーバの電力上限を設定する箇所を判断するために、比較的長い時間各サーバを監視する必要があります。上限が設定された後、ワークロードの変更時に、設定した上限が必要なアプリケーション SLA を確実に満たすようにするためには、継続的な監視が必要です。継続的な監視と上限の設定に関するこの要件は、組織の仮想データセンターが流動的かつ動的になるにつれて強化されています。

Cisco Unified Computing System が電力管理の問題を解決するしくみ


電力上限グループ

静的または動的に個々のシャーシまたはサーバに実装する従来のパワー キャッピングとは異なり、Cisco Unified Computing System は電力上限グループと呼ばれる新しい強力な概念を実装しています。電力上限グループは、サーバまたはシャーシの集合であり、共通の電力割り当てまたは電力バジェットを共有し、グループ内のサーバに動的に適用されます。

電力上限グループ(またはドメイン)は一連の単純なルールに従います。

  • 1 つのシャーシ内のすべてのサーバは、同じ電力上限グループに含まれます。単一の電力上限グループに複数のシャーシを含めることができます。
  • 任意の電力上限グループ内のシャーシには物理的な連続性を持たせる必要はなく、同じ論理 Cisco Unified Computing System インスタンス内であれば任意の場所に配置することができます。この使用例は一般的ではありませんが、スポット冷却の管理に利用できます。
  • 電力上限グループ内のすべてのシャーシが同じ配電回路に接続されている必要はありません。通常はパワー キャッピング グループのすべてのメンバーは同じ回路に接続されていますが、この例では、電力が主な制限要因でないグローバルな冷却制限を管理するために使用することができます。
  • 任意の Cisco Unified Computing System インスタンスには、さまざまな数のシャーシを含む、複数の電力上限グループを持たせることができます(図 6)。

図 6 複数のシャーシ間の電力上限グループ

図 6 複数のシャーシ間の電力上限グループ
※画像をクリックすると、大きな画面で表示されますpopup_icon


Cisco Unified Computing System では、図 6 に示すように、電力上限グループを Cisco UCS Manager の組み込み型管理ソフトウェアを介して有効にすることができます。電力上限グループを実装できる機能は業界独自であり、電源回路または任意の物理境界でこれらを定義できることにより新しい機能を IT 運用管理に取り入れることができます。

電力上限を仮想サーバと関連付ける


現在、市販されているすべての製品では、静的または動的のどちらのパワー キャッピングを提供するかどうかにかかわらず、電力上限がシャーシの特定のスロットまたは物理ラック サーバに関連付けられています。これは、物理サーバ自体で仮想化が行われている製品であっても同様です。特定の物理サーバの ID およびワークロードは変更可能であるため、サーバの電力上限要件を変更すると、物理エンティティまたは固定ロケーションが不適切になります。

Cisco Unified Computing System は、サーバに関連付けられたサービス プロファイル(このドキュメントの後半のサービス プロファイルの説明を参照)に電力上限情報を取り込むことでこの問題を解決します。電力上限設定が移動するワークロードに確実に従うよう、サービス プロファイルに関連付けられるときに、新しい物理サーバが正しい電力上限を継承するように支援します。図 6 は、複数の Cisco UCS シャーシ間で分散される電力上限グループの基本的な概念を示します。

電力上限およびサービス プロファイル


Cisco UCS サービス プロファイルは、Cisco Unified Computing System を構築する基本的な概念の 1 つです。サービス プロファイルとは、LAN および SAN のアドレス、イーサネットとストレージ インターフェイスの数、ファームウェア バージョン、起動順序、ネットワーク VLAN、物理ポート、QoS ポリシーなどの、サーバ ID と物理リソースの要件を論理カプセル化したものです (詳しくは、『Cisco Unified Computing System サービス プロファイルを理解する 』 [英語] を参照)。この基本概念を採用し、別のリソースとして電力を追加してサービス プロファイルに関連付けることで、物理的な ID 管理が物理サーバから切り離して抽象化されるのと同じように、シスコは電力上限の管理を個々のサーバから切り離して抽象化します。

各サービス プロファイルは、電力プロファイルに関連付けられた物理サーバの電力の相対的な優先順位を定義する電源上限ポリシーおよびサーバが所属する電力上限グループに割り当てることができます。すべてのサーバの電力が適切である場合、優先順位は効力を発揮しません。任意の電力上限グループ内のサーバがグループの割り当てを超過し始めると、関連付けられた電力上限グループ ポリシーで定義された優先順位に従って電力が割り当てられ、クリティカルなロードが最後に調整されるようにします。さらに、特定のサーバに対して、電力上限を持たないように指定するオプションもあります。これは、パワー キャッピングを必要とする程度がわずかであっても、サーバのパフォーマンスを落とすことができないワークロードを想定したものです。

電力上限の管理は、各ブレードの Cisco UCS Manager と、各シャーシの Chassis Management Controller(CMC; シャーシ管理コントローラ)、各ブレードのCisco Integrated Management Controller(Cisco IMC)との間で分散されます。

単一のシャーシ上限 UCS Manager では単純に上限がシャーシに割り当てられます。複数のシャーシ グループ上限が定義されている場合、Cisco UCS Manager は、ハードウェア構成とサービス プロファイルの優先順位に基づいてインテリジェントにグループ内のシャーシ間で電力を分割します。この電力分割は動的であり、構成が変化した場合に電力をグループ内のシャーシに再度割り当てることができます。

各 CMC は、シャーシが UCS Manager によって割り当てた電力上限の保持を担当します。グループ内の各シャーシの CMC はブレード タイプ、構成、相対的な優先順位に基づいて電力上限を各ブレードに割り当てます。ブレード Cisco IMC は、ブレードの電力上限を保持するように特定のブレードを管理します。

各ブレードへの電力上限の割り当てが完了したら、Cisco IMC の制御アルゴリズムにより、ブレードは 500 ms 以内の電力上限の下に置かれます。つまり、グループ 電力上限が保持され、回路ブレーカによる遮断が回避されます。

シャーシ内のブレードが電力上限に達し、その上限が 20 秒11続いた場合、割り当てられた上限を現在使用されていないブレードが存在すると、シャーシの CMC は電力を再び割り当てます。簡単に言えば、アイドル状態にあるブレードの電力上限は下がり、上限に達したアクティブなブレードの電力上限は対応する量(関連付けられたサービス プロファイルで定義された優先順位)に応じて増加します。シャーシ内のすべてのブレードが電力上限に達した場合、電力上限は最初の割り当てに戻ります。UCS Manager の将来のリリースでは、高いレベルでシャーシ間の再割り当てが発生するようになる予定です。この処理の頻度は、優先度の高いブレードがシャーシのグループ間で分散される場合は低くなり、同じシャーシにある場合は高くなります。シャーシ間での電力の再割り当ての処理は遅く、30 秒から 1 分かかるため、ユーザはこの分散を認識する必要があります。

IT および設備の役割の分離


効率的な電力管理と制御ソリューションによって解決する必要がある重要な要素の 1 つは、IT 管理者と設備管理者の役割を分離する必要があることです。Cisco UCS Manager は基本的なアーキテクチャで構築された役割を分離することができ、これにより設備管理者は、個々のシャーシまたはシャーシのグループに絶対電力上限値を設定できるようになります。IT 管理者は各サービス プロファイルの電力上限 ポリシーの相対的な優先順位を設定し、サーバがサービス プロファイルに関連付けられたときに、設備管理者によって設定された絶対電力上限値に基づいてサーバ間で電力を自動的に割り当てる方法がシステムに認識されるようにします。

設備管理者が電力上限グループの絶対値を設定できるようにすると、回路レベルでデータセンターの保護が有効になり、分離および連鎖的な障害から保護されます。同時に、IT 管理者はエンド ユーザと作業し、設備管理者の関与を必要とせずに 電力上限グループ内のワークロードの電力を割り当て、最も必要な箇所や、ビジネス プラン全体で最もフィットする箇所にコンピューティング能力を配置することができます。

パワー キャッピングと外部管理


Cisco Unified Computing System には複数の電力および温度センサーが含まれており、システムの動作に関する詳細な消費電力および温度情報を提供します。各ブレードには、ブレードの電力消費に関する情報を提供する電力センサー、および複数の温度センサーが装備されています。さらに、シャーシおよび電源装置は、各シャーシの消費電力の詳細を提供できます。

この管理および監視のすべての情報は、Cisco UCS Manager に組み込まれている XML インターフェイスを介して利用することができます。これは、IT および設備の管理がすでに行われている、BMC、CA、HP、IBM などのベンダーの管理ソフトウェアまたはカスタムツールによって利用される場合があります。これらは複数の管理ドメイン間でのインテリジェントな電力管理に使用することができます。

パワー キャッピングとコスト削減


Cisco UCS 電力上限グループを使用した適切なパワー キャッピングの実装による全体の効果により、現在の電力制約内でのデータセンター全体のコンピューティング キャパシティとスループットを向上します。この結果、毎月の電気料金の節減と多額に上る資本投資の回避の両方が実現されます。これは、データセンターの寿命が長くなり、現在と将来の両方のニーズを見たすようなコンピューティング ヘッドルームが実現するためです。

シスコでは、グループ パワー キャッピングを Cisco Unified Computing System で使用して、同じパワー フットプリントにより多くのサーバを設置することにより、全体のスループットが 10 〜 30% することを確認しました。これは、特定のデータセンターの詳細、ワークロードの構成、電力をプロビジョニングしデータセンターを運用するポリシーによって異なります。

まとめ


Cisco Unified Computing System テクノロジーは、企業のコンピューティング環境の定義を塗り替えてきました。従来のデータセンター モデルを崩し、データセンター インフラストラクチャを仮想サーバ、ストレージ、ネットワーク リソースとして再定義することにより、Cisco Unified Computing System は資本および運用コスト、柔軟性と可用性を向上させ、ビジネスの変化に応答するために IT に必要な時間量を低減する新しいコンピューティング モデルを提供してきました。

Cisco Unified Computing System の管理インフラストラクチャにパワー キャッピング テクノロジーを追加することにより、データセンターで、理論的な最大サーバまたは電源装置の機能でなく、実際の使用に基づいて電力をプロビジョニングすることができます。さらに、サービス プロファイル内で優先順位を使用することにより、データセンターの電力に制約がある環境で最も重要なワークロードに電力を向けることができます。

関連情報


付録:サーバ消費電力に関する事実

CPU 利用率と消費電力の関連付けには注意が必要です。CPU 利用率が 100% のサーバが最大電力を使用しているとは限りません。Intel Xeon プロセッサや AMD Opteron プロセッサなどの近年の CPU のダイには何億個ものトランジスタがありますが、消費電力に影響を及ぼす正体は、実際にアクティブなトランジスタの数です。プログラムの実行中は個々の命令により CPU にあるいくつかのトランジスタがアクティブになるため、アクティブになるトランジスタの数は実際に実行されている命令によって異なります。たとえば、単純な整数レジスタの追加では比較的少ない数のトランジスタのみが使用されます。メモリからキャッシュにデータをストリームし、浮動小数点演算ユニットに送信する複雑な命令では、数百万個のトランジスタが同時にアクティブになります。両方のシーケンスが 100% CPU 利用率を示す可能性がありますが、電力消費量は大きく異なります。より複雑なワークロードでは、その差は 60% 以上になります。

これらの違いの本質は、アプリケーションが実際に行っている内容およびアプリケーションの作成方法によって電力消費は異なるということにあります。同じベンチマークを実行した場合でも、使用するコンパイラ、ベンチマークが特定のプラットフォームに対して最適化されているか、実行される命令の順序が正確であるかによって、違いが見られる場合があります。



1 このドキュメントでは、問題全体の説明に「電力」および「電力および冷却」という用語が同じ意味で使用されている箇所が若干ありますが、これは、冷却が消費電力に付随するものであり、消費電力と直接相関があるためです。このドキュメントで「電力」が文字どおり電気的な力のみを示している箇所については、文脈からご判断いただけると思います。
2 消費電力の課題は、ここで示すよりもさらに複雑です。サーバは、配電およびデータセンターの電力および冷却のアーキテクチャを含む、より広い視野で捉える必要があります。データセンターの電力効率のメトリックである全電力使用効率(PUE)に対して、これらの(サーバに対する)外部要因がもたらす効果は、最良のケースと最悪のケースとでは、約 2 対 1 の差が生じます。
3 たとえば、プロセッサの電力状態または P-States が、ベンダーによって CPU に組み込まれ、OS または他のソフトウェア ユーティリティによる異なる電力レベル間で CPU を切り替えることができます。あるベンダーの電力状態を変更するツールセットが若干優れていたとしても、その差は小さく一時的なものとなります。
4 図 2 の円グラフの「Mechanical(機械的)」のほとんどは、冷却ポンプ、ファン、Computer Room Air Conditioning(CRAC; コンピュータ室空調設備)、適用型エアーフローに関連しています。
5 データセンターの全体像を考慮する際、サーバの運用コストの多くを占めるのは管理であることに留意してください。これは Cisco UCS の管理アーキテクチャで対処できます。前述のように、電力は OpEx の一因のままであり、CapEx の強力な予測因子です。
6 厳密には、回路ブレーカは電流の影響を受けるデバイスであるため、回路の総電流が運用担当者の懸念材料となります。多くの場合、電流は電力と比例関係にあるため、これらの用語は同じ意味で使用できます。
7 データセンターにおいて、回路ブレーカによる遮断は大きな事象です。障害が連鎖的に発生していき、データセンター全体または一部がダウンするという最悪の場合のシナリオを除き、このような事象は過渡電力サージの原因となり、他の機器を停止させる可能性があります。回路ブレーカによる遮断は主要な運用事象として非常に顕著であり、付随する管理が目に見えるものであることも考慮すると、なんとしてでも回避するべきことです。
8 しかし、これは他の多くの高度なテクノロジーにもあてはまります。これらを活用するには、ガバナンス モデル、運用プロセス、場合によってはビジネス プロセスを変更しないと、潜在的な価値の多くが実現されません。
9 運用という観点から見れば、その目的は回路レベルで電力上限を管理することです。1 つの共通回路に、特にラックベースの PDU を介して、接続されているすべてのサーバを管理し、これらのすべてのサーバの消費電力が同時にピークになっても、ブレーカによる遮断が起きないようにする必要があります。設備管理者は、絶対的な上限を常にワットまたはアンペアの値で制御します。
10 多くの企業は、「ユーザ、トランザクション レート、その他のアプリケーション メトリックの X% の増加のうち、消費電力に影響を及ぼすものは何か?」という電力管理の基本的な質問に回答することができません。
11 応答時間は、スパイクが一貫した電力再割り当ての原因となっているヒステリシスの問題を回避するように設計されています。Unified Computing System が電力を再割り当てするようにするには、常時ロードを増大させる必要があります。








お問い合わせ