엔비디아가 B200 및 GB200 플랫폼 기반의 차세대 AI 서버인 블랙웰 머신의 생산 증가에 지연을 겪고 있는 것으로 전해졌습니다. 이는 과열, 전력 소비, 최적화된 상호 연결의 필요성과 관련된 문제 때문입니다. 트렌드포스에 따르면, 블랙웰 머신의 대량 생산 및 최대 출하량은 이제 2025년 중반으로 예상되며, 이는 거의 6개월의 지연을 의미합니다. 현재 엔비디아는 2024년에 저수율의 B200 프로세서에 의존하여 블랙웰 기반 서버를 제한적으로만 출하할 수 있습니다.
델은 블랙웰 서버 랙의 출하를 시작했지만, 블랙웰 기반 서버의 생산 증가가 즉각적으로 이루어질 것으로 예상되지는 않습니다. 10월에 B200 프로세서의 개선된 버전이 대량 생산에 들어가더라도 말입니다. 보고서에서는 엔비디아 NVL72 랙이 140 kW의 전력을 소비하는 등 상당한 전력 소비 우려가 강조되었으며, 이는 일반적인 데이터 센터의 능력을 초과합니다. 이러한 전력 소비는 하드웨어 손상 및 성능 저하를 방지하기 위해 여러 차례의 설계 수정이 필요했던 과열 문제와 관련이 있습니다.
전력 요구량의 증가로 인해 냉각 요구도 높아지고 있습니다. 현재의 냉각수 분배 장치(CDU)는 60 kW에서 80 kW의 열 전력만을 관리할 수 있어, 냉각 시스템 제공업체들이 설계를 개선해야 하는 상황입니다. 트렌드포스는 액체-액체 인라인 CDU의 발전이 과도한 열 방출을 완화할 수 있을 것으로 예상하고 있습니다.
전력 및 냉각 문제 외에도 엔비디아는 상호 연결 최적화 문제도 해결해야 하지만, 이 문제에 대한 구체적인 세부 사항은 아직 불분명합니다. B200A 및 B300 시리즈를 포함한 블랙웰 제품의 향후 출시가 이러한 초기 문제에 영향을 받을 수 있습니다. B200A는 낮은 전력 소비를 예상하고 있지만, B300 시리즈는 메모리 및 컴퓨팅 성능의 증가로 인해 더 많은 전력을 요구할 것으로 예상되며, 랙당 140 kW를 초과할 가능성이 있어 고급 냉각 솔루션이 필요할 수 있습니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.