AI および HPC データセンター
フォールトトレラントソリューション
内蔵メモリ
データセンターがどのようにエネルギー効率の高いテクノロジーと革新的な設計を採用してコスト削減と二酸化炭素排出量の削減を図り、クラウド業界をより環境に優しく持続可能なソリューションへとシフトさせているかをご覧ください。
持続可能性は企業の最優先事項として浮上しており、企業のデータセンターとITシステムは、以下を考慮すると重要な重点分野です。 大量のリソース消費 これらの機器は、ますますエネルギーを大量に消費する処理環境への電力供給と冷却に関与しています。
組織がより高速で強力なコンピューティング環境に移行するにつれて、新しいプロセッサ、GPU、ソリッドステートストレージはすべて、以前のテクノロジーよりも運用に必要な電力が大幅に増えています。場合によっては、これらの大規模データセンターの電力要件が小都市の電力要件に匹敵する場合もあるため、あらゆる規模の組織が、この消費量の増加を相殺できる代替手段を追求するようになっています。
データセンターの効率化と持続可能性に関する独自の取り組みを追求している組織もありますが、多くの組織では、コンピューティングの利用に伴う二酸化炭素排出量を削減すると同時に、IT管理環境を簡素化するためにワークロードをクラウドに移行しています。
何千ものラックのコンピューターサーバーで埋め尽くされた大規模なパブリッククラウドデータセンターが、どういうわけか電力効率の高い選択肢になると考えるのは直感に反するように思えるかもしれませんが、現実には、主要なクラウドプロバイダーは、運用効率/収益性、および持続可能性の両方の理由から、メガデータセンターの運用にかかる電力関連コストの測定、評価、および削減において「ブラックベルト」になっています。
クラウドプロバイダーが取るべき明らかなステップは、できるだけ多くのグリーンエネルギー源または再生可能エネルギー源を活用することであり、彼らはその道を絶対に追求しています。全体的に見ると、主要なパブリッククラウドプロバイダーは、世界最大の再生可能エネルギー消費国です。しかし、これらのITの巨人は、単に持続可能なエネルギーを活用するのではなく、結果にプラスの影響を与えるために、そもそも未処理電力の消費量を減らすことにますます注意を向けています。
エネルギー効率に重点が置かれたことで、電力使用効率 (PUE) と呼ばれる電力関連の指標への新たな関心が高まっています。この指標は、米国エネルギー省などのコンピューティングリソースの大手ユーザーによって実行されるハイパフォーマンスコンピューティング (HPC) ワークロードと長い間関連付けられてきました。
PUEは、データセンターに入る未フォーマット時の電力量を測定し、それをデータセンター内のIT機器の稼働に使用される電力で割ることにより、データセンターのエネルギー効率を測定します。完全に効率的なデータセンターのPUEは1.0です。これは、データセンターに供給される電力の 100% が、無駄なく必要な機器への電力供給に使用されていたことを示しています。
実際には、PUE 計算では、冷却と電力変換に使用される電力を考慮する必要があります。また、冷却要件によって運用の電力要件が上昇する夏の暑い時期を含め、年間平均で測定した測定値を示す必要があります。
主要なクラウドプロバイダーは、PUEを削減するために引き続き多額の投資を行っています。Google 最大のパブリッククラウドデータセンター環境は、一般的なエンタープライズデータセンターの平均で 1.5 倍以上のエネルギー効率を実現しており、他のパブリッククラウドプロバイダーも同様の結果を目指しています。
自動車レースチームが空気力学の小さな効率向上を継続的に発見してレースに勝つのと同じように、クラウド事業者は、データセンターを華氏80度で運営したり、外気を冷却に使用したり、独自の超効率的なサーバーを設計したりするなどの運用上の革新を実施することでエネルギー使用率を削減します。
実際、大規模なパブリッククラウド事業者によるイノベーションと投資の結果は、調査、測定、公開されています。A サイエンス誌に2020年の論文が掲載されました は、主要なクラウドデータセンターで行われるコンピューティングの量は2010年から2018年の間に約550%増加しましたが、これらのデータセンターで消費されるエネルギー量は同じ期間に6%しか増加しなかったことを示しました。
この研究の著者は、これらのエネルギー効率の向上は、経済の他の主要セクターで見られるものを上回っていると指摘しています。
管理者がクラウドベースの構成を正確に構成、調整、開始、停止してユーザーのワークロードのニーズに正確に対応できるようにするインテリジェントな制御プレーンをIT組織に提供することで、クラウドによる電力使用率の削減をさらに高めることができます。
たとえば、従来の企業データセンターでは、サーバーとリソースの構成が固定されており、現在のユーザープロファイルやアクティブなワークロードの必要性に関係なく、通常は「常時稼働」構成で稼働しています。これにより、比較的高いレベルで一貫した電力消費が発生しますが、これはPUEと持続可能性の観点からは最適ではありません。
対照的に、ソフトウェア制御のクラウドベースの環境では、特定のユーザージョブに動的に割り当てることができ、必要に応じて迅速にオン/オフできる20種類のコンピューティングインスタンス構成のカタログが提供される場合があります。
特定のワークロードに必要な量の処理能力を正確に提供するノードタイプをより動的に選択する(そしてそれらのサーバー/インスタンスを必要な場合にのみ利用する)ことで、クラウドプロバイダーがPUEイニシアチブで行っているのと同じタイプの利用最適化をアプリケーション固有ベースで提供できます。
その結果、クラウド内では、完全に安全な方法で、単一のコンピューティングリソースセットを複数のユーザーグループ間、あるいは複数の企業のユーザーグループ間で動的に割り当てたり再割り当てしたりできるようになり、環境を最大限に活用できるようになります。
これは、さまざまなアプリケーションが特定のプロセッサやサーバー構成を使用することでパフォーマンスを大幅に向上させることができる、AI や HPC などの計算集約型ワークロードに特に役立ちます。
ワークロード管理のための高度なソフトウェアコントロールプレーンはクラウドベースの実行の重要な要素ですが、IT組織がオンプレミスのデータセンター環境の最高の要素をパブリッククラウドとシームレスに組み合わせて活用できるようにするハイブリッドクラウド環境の使用が増えています。
このような場合、ソフトウェアベースのコントロールプレーン環境により、IT管理者は現在のアクティビティとシステムのニーズを考慮して、「最適な」場所にワークロードをターゲットにすることができます。たとえば、ワークロードはほとんどの時間オンプレミスで実行されますが、使用率が非常に高い期間には、月次または四半期ごとに、クラウド内のはるかに多くのリソースで「バースト」して実行される可能性があります。
同様に、最新の GPU リソースへのアクセスを必要とする特定のハイパフォーマンスコンピューティングや AI ワークロードは、最新のプロセッサテクノロジーが従量課金制で簡単に利用できるクラウドで実行される場合があります。選択がすべてです。
主要なクラウドプロバイダーがデータセンターの運用効率化への道をリードしていることは間違いありません。その進歩は、クラウドでワークロードを実行する顧客だけでなく、進化するツールやテクニックを活用できるITチームやコロケーション施設運営者の両方に利益をもたらしています。
最先端の企業は、インテリジェントなコントロールプレーンソフトウェアを使用して、組織と持続可能な未来に最大の利益をもたらすために、適切な場所で適切なタイミングでワークロードを実行する方法を見つけるでしょう。
Penguin Solutionsは、AI およびHPCソリューションの信頼できる戦略的パートナーになることができます。25年以上にわたるHPCの経験、7年以上にわたるAI インフラストラクチャの設計と展開、2017年以降、85,000を超えるGPUの導入と管理を行ってきた当社は、いつでも支援する準備ができています。
AI インフラストラクチャーの専門家に問い合わせる 本日、Penguin Solutions AI プロジェクトのニーズについてご相談ください。
Vice President, Global Marketing
Mark は、クラウドコンピューティング、AI、ビッグデータストレージ、HPC、ビジネスプロセス管理のための複雑なエンタープライズインフラストラクチャの設計と実装において、深い技術的知識と幅広いリーダーシップ経験を持っています。
Penguinのチームは、高性能で可用性の高いHPCおよびAI エンタープライズソリューションの設計、構築、導入、管理を行い、お客様が画期的なイノベーションを実現できるよう支援しています。
今すぐお問い合わせいただき、インフラストラクチャソリューションプロジェクトのニーズについてご相談ください。