엔비디아는 2025년 9월에 GB300 기반 서버의 대규모 출하를 시작할 예정이며, 이는 델(Dell)과 같은 파트너의 초기 생산에 이어 이루어집니다. 이번 출하는 전략적 설계 재사용과 개선된 공급망 조정 덕분에 이전 세대보다 원활할 것으로 예상됩니다. GB300 플랫폼으로의 전환은 GB200의 마더보드 설계를 유지함으로써 용이해지며, 고객이 자체 부품을 조달할 수 있는 모듈형 접근 방식을 가능하게 합니다. GB300은 SXM Puck 모듈에서 B300 GPU를 사용하고, 별도의 BGA 패키지에서 Grace CPU를 사용할 예정이며, 엔비디아는 스위치 트레이와 구리 백플레인을 계속 제공할 것입니다. 원래 설계 제조업체(ODM)로부터의 피드백에 따르면, 부품 자격 인증이 순조롭게 진행되고 있으며, 2025년 4분기에는 상당한 생산 증가가 예상됩니다.
GB200의 대량 출하에도 불구하고, 이 플랫폼은 특히 누수에 취약한 퀵 커넥트 피팅과 관련하여 액체 냉각 시스템에서 지속적인 문제에 직면해 있습니다. 데이터 센터 운영자들은 하드웨어 신뢰성보다 배포 속도와 성능을 우선시하며, 국소적인 셧다운 및 광범위한 누수 테스트와 같은 조치를 시행해야 했습니다. 앞으로 엔비디아는 AI 서버를 위한 차세대 베라 루빈(Vera Rubin) 플랫폼도 준비하고 있으며, 이는 새로운 CPU와 GPU를 도입할 예정이지만, 배관 설정과 물 압력의 변동성으로 인해 신뢰성 있게 구현하기 어려운 액체 냉각에 대한 의존도를 더욱 높일 것입니다.
전반적으로 GB300의 모듈형 설계와 GB200의 냉각 문제에서 얻은 교훈은 엔비디아가 경쟁 서버 시장에서 유리한 위치를 차지할 수 있도록 할 수 있지만, 액체 냉각과 관련된 지속적인 문제는 여전히 중요한 우려 사항으로 남아 있습니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.