클라우드 컴퓨팅은 지난 몇 년간 엄청난 혁신의 문을 열었지만 이러한 리소스 소비에는 대가가 따르기도 합니다.스티커 쇼크는 계속되고 있으며 일부 주요 공급자가 인플레이션으로 인해 가격을 인상하면서 더욱 극적으로 증가했습니다.이로 인해 “클라우드 플레이션”이라는 새로운 용어가 탄생하기도 했습니다.

사용한 만큼만 지불하는 클라우드 솔루션을 사용하면 지금 당장 필요한 것을 사용하고 필요에 따라 확장할 수 있습니다. 하지만 적절한 가드레일이 없으면 클라우드 요금이 빠르게 증가하여 통제 불능 상태가 될 수 있습니다.웨이크필드 리서치의 2023년 연구에 따르면 데브옵스 리더 중 98% 설문 조사에 따르면 한 해 동안 예상치 못한 비용 급증이 여러 번 발생했습니다.절반 이상이 매달 예상치 못한 초과 지출이 발생했다고 답했습니다.

솔루션 아키텍트는 최종 사용자, 개발자, 데이터 과학자가 고성능 클러스터에 HPC, AI 및 컨버지드 HPC/AI 워크로드를 더 쉽고 빠르며 비용 효율적으로 배포할 수 있도록 하는 고성능 컴퓨팅 (HPC) 및 AI를 위한 완전 관리형 클라우드 기반 엔드투엔드 솔루션을 지향하고 있습니다.

HPC 및 AI 워크로드 실행을 위한 클라우드 우선 접근 방식

레거시 데이터 센터 인프라를 사용하는 숙련된 HPC 사용자는 하이브리드 클라우드 컴퓨팅 환경에서 초과 용량이 필요할 때 대부분의 워크로드를 온프레미스에서 실행하고 클라우드로 버스트하도록 선택할 수 있습니다.그러나 새로운 HPC 및 AI 사용자는 클라우드 전용 환경에 워크로드를 배포하는 경향이 있습니다.클라우드 전용 환경은 인프라 초기 비용을 크게 줄여주지만 상당한 금액의 (때로는 예상치 못한) 컴퓨팅 요금이 발생할 수 있습니다.

운영 방식에 관계없이 특히 CPU 및 GPU 성능 측면에서 클라우드 리소스를 효율적으로 운영할 수 있는 방법이 필요합니다. 그래야 팀이 필요할 때 예산을 낭비하지 않고도 필요한 컴퓨팅 파워를 확보할 수 있습니다.

그러나 클라우드 배포에는 일반적으로 비용 관리에 필요한 일상적인 사용 관리가 부족하며, 기업 IT 관리자는 일반적으로 광범위한 서비스에 대한 요청에 이미 대응하지 못하고 있습니다.클라우드 플레이션은 특히 고성능 인스턴스의 클라우드 기반 클러스터에서 실행되는 컴퓨팅 집약적 워크로드를 실행하는 사용자에게 빠르게 일어날 수 있습니다.

예를 들어, 데이터 과학팀은 구체적이고 매우 가치 있는 결과를 산출하는 역할을 담당합니다.적시에 결과를 제공하기 위해 시간당 사용 비용이나 팀 예산 대비 지출 프로필을 완전히 인식하지 못한 채 클라우드 기반 컴퓨팅 클러스터를 구성할 수 있습니다.

다른 문제도 있습니다.사용자가 클라우드 리소스 비용을 보여주는 대시보드에 액세스할 수 있더라도 전체 그림을 볼 수 있는 것은 제한적입니다.조직에는 다음과 같은 도구가 필요합니다.

  • 단일 솔루션에서 온프레미스, 전용 클라우드 및 퍼블릭 클라우드 리소스의 사용을 관리합니다.
  • IT 팀이 지출 가드레일을 설정하고 사용 정책을 구현할 수 있도록 지원
  • 재무 팀에 비용 및 사용 보고를 제공하여 더 나은 의사 결정을 지원합니다.

하이브리드 클라우드 컨트롤 플레인

Penguin은 데이터 센터에 있든 클라우드에 있든 관계없이 사용 가능한 모든 컴퓨팅 리소스를 총체적으로 파악함으로써 고성능 클러스터의 HPC, AI 및 컨버지드 HPC/AI 워크로드에 대한 포괄적인 제어 플레인을 제공하여 컴퓨팅 리소스에 대한 수요 증가와 예산 제약의 균형을 맞춥니다.

사용자가 직관적인 중앙 집중식 인터페이스를 통해 수천 개의 코어에 걸쳐 워크플로를 실행할 수 있으므로 필요에 따라 리소스 설정을 제어하고 새 컴퓨팅 리소스를 구성하여 다양한 인스턴스 유형 중에서 선택하고 필요에 따라 풀을 가동하거나 종료할 수 있습니다.

클라우드 및 온프레미스 환경을 최적화하면 용량을 그대로 유지하면서 비용을 제어하고 고가용성, 버스팅, 최대 수천 개의 노드까지 확장할 수 있습니다.이를 통해 지원 담당자를 고용하지 않고도 클라우드를 관리할 수 있습니다.

컴퓨팅 비용 제어

컴퓨팅 환경을 최적화하는 것 외에도 지출을 관리할 수 있는 강력한 도구가 제공됩니다.클라우드 비용을 면밀히 모니터링하더라도 많은 클라우드 제공업체는 24시간 지연된 지출 데이터만 제공합니다.수백 개의 노드를 가동하는 경우 막대한 비용이 발생하여 다음 날이 되어서야 알 수 있습니다.

몇 분 안에 클라우드 청구 및 사용 데이터를 자동으로 가져와서 분석하므로 지출을 더 잘 예측하고 관리할 수 있습니다.또한 초과 지출을 방지하는 규칙을 활성화하고 프로젝트 그룹이 지출 임계값에 도달하면 알림을 제공할 수 있습니다.

클라우드 컴퓨팅 리소스 및 비용 최적화

기본 제공되는 비용 관리 기능을 갖춘 모든 주요 클라우드 서비스 공급자와 함께 작동하는 단일 인터페이스에서 HPC 및 AI 워크로드의 모든 측면을 관리합니다.

혜택은 다음과 같습니다.

  • 컴퓨터 지출에 대한 통찰력을 제공하는 직관적인 인터페이스
  • 재사용 및 공유 가능한 워크플로우를 만드는 도구
  • 클라우드 및 온프레미스 클러스터를 위한 리소스 할당
  • 시뮬레이션 실행을 위한 워크로드 처리 및 결과 평가
  • 수십 개의 HPC 및 AI 애플리케이션을 위한 사전 구축된 워크플로우

지출을 제어하면서 HPC 및 AI 워크로드를 간소화합니다.

HPC 및 AI용으로 특별히 구축되었으며 구글 클라우드 플랫폼 (GCP), 아마존 웹 서비스 (AWS), 마이크로소프트 애저 등에서 완전히 검증되었습니다. 펭귄 온디맨드 (POD), 최종 사용자는 비용 관리 및 예산 제약 내에서 작업하면서 인프라 제한에 대해 걱정할 필요 없이 필요한 컴퓨팅 리소스에 액세스할 수 있습니다.조직은 인프라를 최적화하고 월별 청구서에 큰 충격이 생기는 것을 방지할 수 있습니다.

Penguin Solutions로 HPC 및 AI 워크로드를 최대한 활용하세요.추가 정보를 원하시면 Penguin Solutions에 문의하기 오늘.

작성자 이미지

관련 기사

Server aisle

에서 전문가와 상담하세요
Penguin Solutions

Penguin에서 우리 팀은 고성능, 고가용성 HPC 및 AI 엔터프라이즈 솔루션을 설계, 구축, 배포 및 관리하여 고객이 획기적인 혁신을 달성할 수 있도록 지원합니다.

오늘 연락하셔서 인프라 솔루션 프로젝트 요구 사항에 대해 논의해 보겠습니다.

렛츠 토크