슈퍼마이크로의 데이터센터 규모 액체 냉각 솔루션, 엔비디아 블랙웰을 위한 기반 마련

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Anton Shilov | 작성일: 2024-10-08 11:30
사이트 내 게시일: 2024-10-08 11:50
슈퍼마이크로는 차세대 엔비디아 블랙웰 서버의 전력 수요를 지원하기 위해 설계된 데이터센터 규모의 액체 냉각 솔루션을 공개했습니다. 특히 72개의 엔비디아 B200 GPU를 사용하는 서버는 약 120kW의 전력을 소비할 것으로 예상되며, 이는 일반적인 랙 전력 소비량보다 상당히 높은 수치로, 고급 냉각 솔루션이 필요합니다.

새로운 시스템은 냉각수 분배 장치(Coolant Distribution Units, CDU), 콜드 플레이트, 냉각수 분배 매니폴드(Coolant Distribution Manifolds, CDM), 냉각탑, 그리고 종합 관리용 슈퍼클라우드 컴포저(SuperCloud Composer) 소프트웨어와 같은 필수 구성 요소를 포함하고 있습니다. 이 설정은 데이터센터의 에너지 효율성을 향상시켜 초기 투자 비용과 총 소유 비용(Total Cost of Ownership, TCO)을 줄이는 것을 목표로 하고 있습니다.

슈퍼마이크로의 냉각 기술은 초밀집 AI 서버에 맞춰져 있으며, 4U 공간에 듀얼 최상급 CPU와 최대 8개의 엔비디아 HGX GPU를 수용할 수 있는 구성을 가능하게 하며, 랙당 최대 96개의 B200 GPU를 장착할 수 있습니다. 이 구성은 전통적인 설정에 비해 컴퓨팅 밀도를 네 배 높입니다.

액체 냉각 솔루션의 주요 이점으로는 신속한 배치 능력이 있으며, 설치 시간을 몇 개월에서 몇 주로 단축할 수 있습니다. 또한 최대 12kW의 전력을 요구하는 서버와 100kW 이상의 열을 발생시키는 AI 랙을 효율적으로 냉각할 수 있는 극한의 열 수준을 처리할 수 있습니다. 이 시스템은 113°F(45°C)까지 도달하는 온수 냉각을 지원하여 냉각 효율성을 높이고 지역 난방과 같은 응용 프로그램에서 열 재활용을 가능하게 합니다.

슈퍼클라우드 컴포저 소프트웨어는 실시간 모니터링 및 제어 기능을 제공하여 데이터센터 운영자가 비용을 관리하고 시스템 신뢰성을 보장하는 데 도움을 줍니다. 슈퍼마이크로는 이 액체 냉각 솔루션을 사용하여 일부 대규모 AI 시설에서 100,000개 이상의 GPU를 성공적으로 구현하였으며, 이는 배치 경험과 혁신에 대한 헌신을 보여줍니다. 이 회사는 완전한 솔루션이 데이터센터의 신속한 배치 및 현대화를 촉진하여 운영자의 기술적 및 재정적 목표에 부합한다고 강조하고 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: Cooling
태그: Nvidia (852) AI (638) Blackwell (108) Energy Efficiency (78) liquid cooling (48) Supermicro (34) cooling technology (20) Datacenter (14) SuperCloud Composer (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.