Nvidia는 576개의 GPU를 탑재하고 AI 프로젝트를 위해 11.5 ExaFLOPS(FP4)의 컴퓨팅 성능을 제공하는 '즉시 사용 가능한 AI 슈퍼컴퓨터'인 블랙웰 울트라 DGX 슈퍼포드를 공개했습니다. 그러나 새로운 카이버 랙은 이 설정을 단일 랙으로 압축할 수 있는 가능성을 보여줍니다.
Nvidia의 CEO인 젠슨 황은 확장을 하기 전에 구성 요소 밀도를 높이는 것이 중요하다고 강조하며, 카이버 랙이 이 방향으로 중요한 발전을 나타낸다고 밝혔습니다. 카이버 랙은 2025년 GTC에서 더 두드러지게 선보일 계획입니다.
카이버 랙은 576개의 GPU를 단일 유닛에 수용하도록 설계되었으며, 144개의 칩 패키지가 여러 NVLink 스위치를 통해 상호 연결되어 있습니다. 이 시스템은 600 kW의 전력을 요구하며, 이는 144개의 GPU에 대해 132 kW를 요구하는 GB200 NVL72 및 GB300 NVL144 모델에 비해 상당히 증가한 수치입니다.
카이버 랙의 주요 혁신 중 하나는 NVLink 구리 케이블을 제거하여 이전 모델에 비해 GPU 밀도를 네 배로 증가시킨 것입니다. 이는 전통적인 컴퓨트 트레이를 책장에 배열된 컴퓨트 블레이드로 교체하는 랙 구조의 완전한 재설계를 통해 이루어졌습니다. 각 컴퓨트 블레이드는 이전 트레이의 절반 깊이이며, 시스템은 전통적인 냉각 방법을 없애고 완전 액체 냉각 아키텍처로 전환됩니다.
새로운 미드플레인 PCB는 NVLink 스위치의 효율적인 통합을 가능하게 하고 액체 냉각 시스템을 지원하는 중요한 구성 요소로 작용합니다. 이로 인해 GPU 수 기준으로 네 배 더 밀집된 랙이 탄생했으며, 144개의 칩 패키지가 576개의 GPU를 수용하게 됩니다. 이전에는 패키지당 두 개의 GPU가 있었습니다.
현재로서는 고객들이 블랙웰 울트라 DGX 슈퍼포드에 만족해야 할 것입니다. 이 모델은 576개의 GPU를 탑재하고 있지만, 하이브리드 냉각 방식으로 네 개의 랙에 분산되어 있습니다. 이 모델은 즉시 사용 가능한 AI 슈퍼컴퓨터로 마케팅되며, FP4에 대해 11.5 ExaFLOPS를 달성하고 올해 말 Nvidia의 파트너를 통해 제공될 예정입니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.