CoreWeave와 Dell이 애틀랜타에서 열리는 HPC 컨퍼런스 SC24와 맞물려 Blackwell 랙의 첫 배송을 발표했습니다. 그러나 잠재적인 열 문제도 제기되어 이 문제가 해결되었는지에 대한 의문이 제기되고 있습니다.
엔비디아 NVL72 랙은 36개의 Grace CPU와 72개의 Blackwell GPU를 탑재하고 있으며, 액체 냉각 시스템을 사용합니다. 보도에 따르면, 몇 달 전부터 열 문제가 발생하여 설계 조정이 필요했으나, 이러한 조정이 실제로 이루어졌는지는 불확실합니다. 파트너들은 랙 디자인을 여러 차례 수정하라는 지시를 받았다고 전해집니다.
엔비디아는 Blackwell GPU와 관련된 이전 문제로 인해 생산량이 감소했음을 확인했지만, 엔비디아와 TSMC는 이 문제가 해결되었다고 믿고 있습니다. 로이터에 대한 성명에서 엔비디아는 모든 배송이 예정대로 진행되고 있으며, 문제 해결을 위해 파트너들과 협력하고 있다고 밝혔으나, "예상대로"라는 표현은 여전히 우려가 남아있음을 암시할 수 있습니다.
열 문제 보고에도 불구하고, CoreWeave와 Dell은 GB200 시스템의 첫 배송을 발표하며 부정적인 소식을 빠르게 반박했습니다. 이 시스템의 기반은 새로운 Dell PowerEdge XE9712로, 구성 요소의 높은 전력 소비로 인해 도전 과제가 발생하여 랙 디자인의 혁신을 이끌어냈습니다.
또한, Dell은 7월에 다양한 랙 영역에서 효율성을 최적화하기 위한 향상된 냉각 관리에 대한 포괄적인 특허를 받았습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.