엔비디아와 슈퍼마이크로: AI 데이터 센터가 열을 식히는 방법

전문: https://www.computerbase.de/2024-08/nvidia-und-supermicro-wie-ai-re...

원저자: Volker Rißka | 작성일: 2024-08-26 14:30
사이트 내 게시일: 2024-08-26 14:48
IT 산업은 AI 데이터 센터에서 CPU와 GPU의 전력 소비가 기하급수적으로 증가함에 따라 냉각 솔루션에 점점 더 집중하고 있으며, 이는 ISC 2024와 Hot Chips 2024에서 강조되었습니다. 효과적인 냉각에 대한 수요는 뜨거운 주제가 되었으며, 스타트업과 대기업 모두 혁신적인 솔루션을 탐색하고 있습니다. AI 열풍에 힘입어 GPU 사용이 급증하면서 데이터 센터는 수만 개의 GPU를 수용하게 되었고, 프로세서의 전력 소비는 500와트를 초과하고 GPU는 1,000와트에 달하며, 앞으로 더 증가할 것으로 예상됩니다.

전통적으로 데이터 센터의 랙은 약 12킬로와트를 소비했으나, 이는 120킬로와트로 증가했으며, 곧 다시 두 배로 늘어날 것이라는 전망이 있습니다. 이러한 추세는 공기 냉각만으로는 부족해지면서 액체 냉각 솔루션으로의 중요한 전환을 나타냅니다. 공기 냉각이 완전히 구식은 아니지만, 열 관리를 효과적으로 하기 위해 액체 냉각 부품으로 보완되는 경우가 많아지고 있으며, 데이터 센터의 냉각 전력 소비 비율(PUE)을 최소화하는 것을 목표로 하고 있습니다.

새로운 그린필드 투자에서는 완전 액체 냉각 시스템을 채택하도록 권장하고 있으며, 이는 상당한 이점을 약속합니다. 슈퍼마이크로와 엔비디아는 팬이 소음을 발생시킬 뿐만 아니라 상당한 전력을 소비하면서도 계산 성능에 기여하지 않는다고 강조합니다. 액체 냉각을 구현함으로써 데이터 센터는 팬을 최대 80%까지 제거할 수 있어 상당한 에너지 절약을 이룰 수 있습니다. 슈퍼마이크로는 액체 냉각 데이터 센터가 장기적으로 공기 냉각 대안보다 비용 효율적일 수 있다고 주장합니다.

후면 열 교환기와 침수 액체 냉각과 같은 전환 솔루션이 주목받고 있으며, 이러한 시스템을 소규모 설정에 통합하기 위한 연구가 진행되고 있습니다. 엔비디아는 특히 원자로 냉각 분야에서 경력을 가진 전문가들의 전문성을 활용하여 GPU에 맞춤형 솔루션을 개발하고 있습니다. 그들의 연구에는 냉각 성능을 분석하고 열 방출을 최적화하기 위해 디지털 트윈을 사용하는 것이 포함됩니다.

랙과 서버의 전력 소비 한계를 결정하는 데 초점을 맞추고 있으며, 열 제거 능력을 평가하기 위한 실험이 진행되고 있습니다. 엔비디아가 선호하는 냉각제인 PG-25는 특정 이점을 제공하지만 부식 위험과 같은 문제도 동반합니다. 새로운 칩의 설계는 효과적인 냉각 솔루션의 필요성에 영향을 받으며, 열 관리를 보장하기 위해 더 큰 칩이 선호되고 있습니다.

메가와트 용량의 랙을 달성하기 위한 연구가 지속되고 있으며, 따뜻한 물의 처분과 같은 지속 가능성 문제도 다루어지고 있습니다. 이 따뜻한 물은 지역 난방이나 전기 생산에 활용될 수 있습니다. 이 기사는 AI 데이터 센터의 진화하는 환경에서 혁신적인 냉각 기술의 중요성을 강조합니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: Cooling
태그: Nvidia (852) AI (638) data centers (98) Thermal Management (78) power consumption (55) liquid cooling (48) cooling solutions (46) sustainability (41) Supermicro (34)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.