AI 및 HPC 데이터센터
내결함성 솔루션
통합 메모리
고가용성은 엣지 컴퓨팅의 전제 조건입니다.가용성이란 무엇인지, 가용성을 높이는 방법, 엣지 컴퓨팅에 고가용성이 필수적인 이유는 다음과 같습니다.
PC에 문제가 생긴 적이 있으신가요?이 경우 원래 용도대로 수리할 때까지 PC를 사용할 수 없습니다.문제를 해결할 때까지 PC를 사용할 수 없습니다.이러한 경우 사용률이 낮은 PC를 “저가용성”이라고 합니다.반면 가동률이 높은 시스템은 고장이 나지 않고 안정적인 운영을 지속하기 어려운 상황이나 장애가 발생하더라도 즉시 복구할 수 있는 시스템을 갖추고 있기 때문에 “고가용성”이라고 불립니다.즉, 시스템을 사용하고 싶을 때 얼마나 사용할 수 있는지를 가용성이라고 생각할 수 있습니다.“신뢰성”과 “유지 관리”와 같이 비슷한 의미를 가진 단어가 있다는 점에 유의하는 것이 중요합니다.“신뢰성”은 주로 시스템을 망가뜨리는 데 따르는 어려움의 한 유형입니다.고장의 원인은 시동 후 얼마나 많은 문제를 일으킬 수 있는지입니다.신뢰도는 일반적으로 평균 고장 간격 (“평균 고장 간격”의 MTBF라고도 함) 이라는 지표를 사용하여 시간 단위로 표현됩니다.MTBF 값이 높을수록 고장 간격이 길어져 신뢰성이 더 높습니다.
또 다른 “유지 보수성”은 유지 보수 및 수리의 용이성을 나타냅니다.즉, 문제가 발생한 후 얼마나 걸리나요?이를 시간 기준으로 생각하는 것이 일반적이며, 영어로 MTTR (평균 회복 시간) 이라는 지표를 사용합니다.MTBF와 달리 MTTR은 숫자가 적을수록 좋습니다.즉, 복구 시간이 짧을수록 유지 관리가 더 쉽습니다.
가용성은 일반적으로 MTTR과 MTBF의 합계인 “사용률”이라고 합니다.즉, 신뢰성 향상과 유지보수성 간의 관계가 가용성도 개선합니다.
생산 시스템을 포함한 모든 시스템은 비용이 허용하는 한 높아야 하므로 가용성을 높이기 위한 다양한 조치가 취해졌습니다.구체적으로 살펴보도록 하겠습니다.
지금까지 살펴본 가용성에 대한 기본 지식을 바탕으로 반도체 생산 라인을 고가용성이 필요한 구체적인 현장으로 생각해 보겠습니다.반도체 생산 라인의 주요 적은 먼지와 먼지입니다.그 이유는 반도체가 나노미터 (10억분의 1미터) 단위로 설계되고, 물론 제조 과정에서 매우 훌륭한 작업을 수행하기 때문입니다.이러한 이유로 인간의 눈에는 보이지 않는 먼지도 나노미터 세계에 큰 영향을 미칠 수 있습니다.
먼지는 공기 중에서 이동하므로 공기 흐름이 방해되면 먼지가 확산됩니다.이러한 이유로 항상 공기의 흐름을 제어해야 하는데, 클린룸에서는 반드시 위에서 아래로 공기가 흐르는데 이를 하향류라고 합니다.또한 문을 열고 닫을 때에도 공기가 흐트러지기 때문에 클린룸의 입구와 출구를 양문으로 만들어 영향을 최대한 방지할 수 있습니다.
그러나 이러한 엄격한 메커니즘을 깨뜨리는 요소는 바로 인간입니다.인간은 꼭 움직이기 때문에 공기도 흐릅니다.또한 땀과 호흡은 반도체 웨이퍼를 오염시킬 수 있습니다.이러한 인간 오염 물질은 인간이 활동하는 한 반드시 배출되며 막을 수 없습니다.
이러한 이유로 클린룸에서는 라인 가동 및 유지 보수를 제외하고는 가능한 한 사람이 개입하지 않고 무인 작업을 수행하는 경우가 많습니다.앞서 언급한 것처럼 엣지 컴퓨팅을 사용한 원격 모니터링은 이러한 환경에서 매우 효과적인 것으로 간주됩니다.
가용성이 높은 또 다른 이유는 회선의 총 가격이 매우 높기 때문입니다.반도체 제조는 매우 미세하게 가공되기 때문에 한계에 가까운 정밀도가 요구되는 경우가 많으며, 수천억 엔에서 경우에 따라 천억 엔 이상을 넘을 수 있는 라인도 드물지 않습니다.또한 수요의 물결이 크게 변화하는 시장 구조이기도 하기 때문에 한 번에 생산 라인을 가동하기 위해 자본 투자를 하는 것이 일반적입니다.조속한 자본금 회수를 위해 365일 24시간 운영됩니다.이러한 환경에서 제조 장비의 가용성이 높은 수준에서 요구되는 것은 당연합니다.
가용성이 낮은 엣지 컴퓨팅을 이러한 고가용성 생산 라인에 배포하면 어떻게 될까요?기본적으로 엣지 서버에 필요한 기능은 제품 데이터를 수집하는 것뿐만 아니라 제조 장비의 갑작스러운 단전 및 결함을 모니터링하고 담당 부서에 알리는 것입니다.즉, 언제 발생할지 모르는 결함과 문제를 지속적으로 모니터링하는 것이 필요합니다.항상 모니터링해야 하는 엣지 서버를 자주 중지하면 제조 장비 문제를 해결하는 데 필요한 역할을 수행할 수 없습니다.즉, 엣지 서버의 고가용성은 엣지 서버에 필요한 기본 기능이 될 수 있습니다.
요즘에는 다양한 제품의 판매주기가 단축되었습니다.결과적으로 생산 라인을 신속하게 가동하고 자본 투자를 한 번에 회수하는 스타일은 더 이상 제조업에서 그리 드문 일이 아닙니다.이는 또한 무인 운영과 연중무휴 운영이 점점 더 보편화되고 있음을 의미합니다.이러한 환경에 필요한 고가용성을 달성하려면 프로덕션 시스템에 엣지 컴퓨팅을 배포하는 것이 좋습니다.하지만 엣지 서버 자체도 프로덕션 시스템에 맞게 가용성이 높아야 합니다.따라서 비용이 적당하다면 엣지 서버의 가용성이 높은 서버를 선택하는 것이 가장 좋습니다.
Penguin에서 우리 팀은 고성능, 고가용성 HPC 및 AI 엔터프라이즈 솔루션을 설계, 구축, 배포 및 관리하여 고객이 획기적인 혁신을 달성할 수 있도록 지원합니다.
오늘 연락하셔서 인프라 솔루션 프로젝트 요구 사항에 대해 논의해 보겠습니다.