엔비디아는 현대 클라우드 데이터 센터에서 발생하는 심각한 물 소비 문제를 해결하기 위해 GB200 NVL72 및 GB300 NVL72 기계에 직접 칩 액체 냉각 시스템을 도입하고 있습니다. 이 시스템은 기존 냉각 방법에 비해 에너지 효율이 25배, 물 효율이 300배 더 뛰어난 것으로 보고되고 있습니다. 그러나 엔비디아의 H100 기반 랙은 40kW 이상의 전력을 소비하는 반면, 새로운 GB200 및 GB300 시스템은 120kW에서 140kW 사이의 전력을 소비하여 일반 데이터 센터 서버 랙이 약 20kW를 소비하는 것에 비해 상당히 높은 수치입니다.
직접 칩 액체 냉각 시스템은 GPU, CPU 및 기타 열 발생 구성 요소에 부착된 냉각판을 통해 냉각제를 순환시켜 물의 증발로 인한 손실을 최소화하는 폐쇄 루프 시스템입니다. 이 시스템은 따뜻한 물 냉각을 사용할 수 있게 하여 기계식 냉각기에 대한 의존도를 줄이고, 에너지 효율성과 물 절약을 향상시킵니다. 이러한 장점에도 불구하고 데이터 센터에서 폐쇄 루프 액체 냉각 솔루션을 채택하는 데는 유지보수 접근성, 배관의 물류 복잡성, 기존 데이터 센터 인프라의 비싼 재설계 필요성 등의 도전 과제가 존재합니다.
엔비디아의 블랙웰 프로세서는 뛰어난 성능을 제공하여 데이터 센터 운영자들이 이러한 재설계에 투자하도록 유도할 수 있습니다. 이 회사는 슈나이더 일렉트릭과 협력하여 1152 GPU DGX 슈퍼포드 클러스터를 위한 참조 설계를 개발하였으며, 이는 효율성을 극대화하기 위해 고급 냉각 기술을 활용합니다. 엔비디아는 블랙웰 B200 GPU에 대해 액체 냉각을 의무화하고 있으며, 증발 냉각에서 밀폐형 액체 냉각 솔루션으로의 전환은 물 절약을 위한 전략적 조치로, 현대 데이터 센터 운영의 맥락에서 중요한 거래를 제시합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.