クラウドコンピューティングは、ここ数年で驚異的なイノベーションへの扉を開いてきましたが、このようなリソースの消費には代償も伴います。ステッカーショックは続いており、一部の主要プロバイダーがインフレにより価格を引き上げているため、さらに劇的になっています。これにより、「クラウドフレーション」という新しい用語も生まれました。

従量課金制のクラウドソリューションでは、必要なものを今すぐ使用してオンデマンドで拡張できますが、適切なガードレールがないと、クラウド料金が急速に増加し、制御不能になる可能性があります。ウェイクフィールド・リサーチによる2023年の調査では、 DevOps リーダーの 98% 調査対象者は、1年の間に何度か予想外のコスト急上昇を経験しました。半数以上が、毎月予期しない超過料金が発生したと答えています。

ソリューションアーキテクトは、エンドユーザー、開発者、データサイエンティストが HPC、AI、およびコンバージド HPC/AI ワークロードを高性能クラスターに簡単に、より速く、より費用対効果の高い方法でデプロイできるようにする、ハイパフォーマンスコンピューティング (HPC) と AI 向けのフルマネージドクラウドベースのエンドツーエンドソリューションを推進しています。

HPC と AI ワークロードを実行するためのクラウドファーストアプローチ

レガシーデータセンターインフラストラクチャを使用する経験豊富な HPC ユーザーは、ハイブリッドクラウドコンピューティング環境で余剰容量が必要な場合には、ほとんどのワークロードをオンプレミスで実行し、クラウドにバーストするという選択肢があります。ただし、HPC や AI の新規ユーザーは、クラウドのみの環境にワークロードをデプロイする傾向があります。クラウドのみの環境では、インフラストラクチャにかかる多額の初期費用を削減できますが、多額のコンピューティングコストが発生する可能性があり、場合によっては予期しない計算コストが発生する可能性があります。

運用方法にかかわらず、クラウドリソースを効率的に運用する方法が必要です。特に CPU と GPU の処理能力に関しては、チームが予算を無駄にすることなく、必要なときに必要な処理能力を利用できるようにする必要があります。

しかし、クラウドの導入では、コスト管理に必要な日常的な使用状況の監視が一般的に行われておらず、企業のIT管理者は通常、すでに幅広いサービスの要求に応えきれていません。クラウドフレーションは、特に高性能インスタンスのクラウドベースのクラスター上で実行される、計算量の多いワークロードの実行を担当するユーザーにとっては特に顕著です。

たとえば、データサイエンスチームには、具体的で価値の高い結果を生み出す責任があります。タイムリーな結果を出すために、時間単位の使用コストや、チームの予算に対する支出プロファイルを十分に把握していない状態で、クラウドベースのコンピューティングクラスターを構成することがあります。

他にも課題があります。ユーザーがクラウドリソースのコストを示すダッシュボードにアクセスできたとしても、全体像を把握することは限られています。組織には次のようなツールが必要です。

  • オンプレミス、専用クラウド、パブリッククラウドのリソースの使用を1つのソリューションで管理
  • ITチームが支出のガードレールを確立し、利用ポリシーを実施できるようにする
  • 財務チームにコストと使用状況のレポートを提供して、より適切な意思決定を支援します

ハイブリッドクラウドコントロールプレーン

Penguin は、データセンターにあるかクラウドにあるかにかかわらず、利用可能なすべてのコンピューティングリソースをこのように全体的に把握することで、ハイパフォーマンスクラスター上の HPC、AI、コンバージド HPC/AI ワークロードのエンドツーエンドのコントロールプレーンを提供し、増加するコンピューティングリソースへの需要と予算上の制約のバランスを取ります。

ユーザーは、一元化された直感的なインターフェイスから数千のコアにわたるワークフローを実行できるため、リソース設定を制御したり、必要に応じてさまざまなインスタンスタイプを選択したり、プールを起動または停止したりして、必要に応じてリソース設定を制御したり、新しいコンピューティングリソースを構成したりできます。

クラウド環境とオンプレミス環境を最適化することで、容量を犠牲にすることなくコストを管理でき、高可用性、バースト、および数千ノードへのスケールアップが可能になります。これにより、サポートスタッフを煩わせることなくクラウドを管理できます。

コンピュートコストの管理

コンピューティング環境を最適化するだけでなく、支出を管理するための堅牢なツールも利用できます。クラウドのコストを注意深く監視していても、多くのクラウドプロバイダーは支出データを 24 時間遅らせてしか提供していません。何百ものノードを稼働させていると、高額な請求が発生し、翌日までわからないことがあります。

クラウドの請求および使用状況データを数分以内に自動的に取得して分析できるため、支出をより正確に予測して管理できます。また、ルールを有効にして過剰支出を防止し、支出の基準額に達したときにプロジェクトグループに通知を送ることもできます。

クラウドコンピューティングリソースとコストの最適化

コスト管理機能が組み込まれたすべての主要なクラウドサービスプロバイダーと連携する単一のインターフェースから、HPCとAI ワークロードのあらゆる側面を管理できます。

利点には以下が含まれます。

  • 直感的なインターフェイスで、パソコンの支出状況を把握できます
  • 再利用可能で共有可能なワークフローを作成するためのツール
  • クラウドクラスターとオンプレミスクラスターへのリソース割り当て
  • シミュレーションを実行するためのワークロード処理と結果評価
  • 数十種類の HPC および AI アプリケーション用の事前構築済みワークフロー

支出を抑えながら HPC と AI のワークロードを合理化

HPC と AI に特化した設計で、Google クラウドプラットフォーム (GCP)、アマゾンウェブサービス (AWS)、Microsoft Azure、および Penguin オンデマンド (POD)、エンドユーザーは、コスト管理と予算の制約の範囲内で作業しながら、インフラストラクチャの制限を気にすることなく必要なコンピューティングリソースにアクセスできます。組織はインフラストラクチャを最適化し、毎月の請求額に煩わされる事態を回避できます。

Penguin Solutions で HPC と AI のワークロードを最大限に活用しましょう。追加情報については、 Penguin Solutions にお問い合わせください 今日。

著者画像

関連記事

Server aisle

専門家にご相談ください
Penguin Solutions

Penguinのチームは、高性能で可用性の高いHPCおよびAI エンタープライズソリューションの設計、構築、導入、管理を行い、お客様が画期的なイノベーションを実現できるよう支援しています。

今すぐお問い合わせいただき、インフラストラクチャソリューションプロジェクトのニーズについてご相談ください。

話そう