엔비디아의 최신 AI 슈퍼컴퓨터가 GB300 NVL72 플랫폼을 기반으로 델에 의해 AI 클라우드 서비스 제공업체인 CoreWeave에 최초로 배포되었습니다. 초기 배포에는 72개의 엔비디아 Blackwell Ultra GPU, 36개의 ARM 기반 72코어 Grace CPU, 36개의 BlueField DPU가 포함된 델 통합 랙이 특징입니다.
각 GB300 NVL72 랙은 1.1 엑사플롭스의 밀집 FP4 추론 성능과 0.36 엑사플롭스의 FP8 훈련 성능을 제공할 수 있으며, 이는 이전 GB200 NVL에 비해 50% 향상된 수치입니다. 시스템은 20TB의 HBM3E와 총 40TB의 RAM을 장착하고 있습니다. 또한 엔비디아의 Quantum-X800 인피니밴드 스위치와 ConnectX-8 슈퍼닉을 활용하여 최대 14.4GB/s의 속도로 확장 연결을 지원하며, 이는 이전 모델의 두 배에 해당합니다.
이 시스템은 훈련 및 추론에서 높은 성능을 발휘하도록 설계되었으며, GPU당 최대 1,400W에 달하는 상당한 전력 소비로 인해 액체 냉각 기능을 갖추고 있습니다. 델은 이러한 엔비디아 GB300 기반 솔루션의 배포가 신속한 배치 및 통합에 대한 그들의 전문성과 헌신을 보여준다고 강조합니다.
이번 배포는 CoreWeave의 클라우드 플랫폼을 향상시켜 더 발전된 대형 언어 모델 훈련 및 추론 프로세스를 지원할 수 있게 할 것으로 기대됩니다. CoreWeave가 더 많은 GB300 NVL72 랙을 추가함에 따라 고객에게 제공되는 전체 성능이 증가할 것입니다.
특히, 이번 배포는 GB200 NVL72 기계가 도입된 지 불과 7개월 만에 이루어져 원래 플랫폼의 지속 가능성에 대한 의문을 제기합니다. 클라우드 서비스 제공업체의 관점에서 볼 때, 더 높은 성능을 가진 Blackwell Ultra 기계에 투자하는 것이 원래 Blackwell 시스템보다 더 유리해 보이며, 이는 엔비디아의 최신 제품에 대한 수요가 급증할 가능성을 나타냅니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.