엔비디아, 블랙웰 서버 설치 진행 상황 공개 — AI 및 데이터 센터 로드맵에 따르면 블랙웰 울트라가 내년에 출시되며, 베라 CPU와 루빈 GPU는 2026년에 출시 예정

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Jarred Walton | 작성일: 2024-08-23 15:00
사이트 내 게시일: 2024-08-23 15:19
엔비디아는 핫 칩스 2024 전시회를 앞두고 블랙웰 플랫폼을 선보이며 진행 중인 서버 설치 및 구성 상황을 강조했습니다. 이번 시연은 이전의 지연에도 불구하고 플랫폼의 출시가 임박했음을 확인하는 역할을 합니다. 회사는 또한 호퍼 H200 솔루션, 쿼사르 양자화 시스템을 이용한 FP4 LLM 최적화, 데이터 센터를 위한 온수 액체 냉각 기술의 발전에 대해 논의하며 블랙웰이 GPU에 국한되지 않는 포괄적인 생태계를 대표한다고 강조했습니다.

로드맵에 따르면 블랙웰 울트라가 내년에 출시되며, 이어서 2026년에 베라 CPU와 루빈 GPU가 출시될 예정입니다. 베라 울트라는 2027년에 출시될 것으로 예상됩니다. 블랙웰은 보고된 바에 따르면 3개월의 지연이 있었으나, 엔비디아는 이를 확인하지 않고 블랙웰 GB200 랙과 NVLink 스위치의 설치 과정 및 내부 하드웨어 이미지를 공개했습니다. 이 하드웨어는 높은 전력 소비와 강력한 냉각을 위해 설계되어 프리미엄 비용을 암시합니다.

기존 H200의 성능 지표에 따르면, Llama 3.1 70B 파라미터 모델을 활용하여 포인트 투 포인트 설계에 비해 추론 작업에서 최대 1.5배 높은 성능을 달성할 수 있습니다. 블랙웰은 NVLink 대역폭을 두 배로 늘릴 예정이며, NVLink 스위치 트레이는 총 14.4 TB/s의 대역폭을 제공합니다.

데이터 센터의 전력 수요 증가에 대응하기 위해 엔비디아는 파트너와 협력하여 성능과 효율성을 향상시키고 있습니다. 특히, 온수 냉각 시스템의 도입으로 전력 사용량이 28% 감소한 것으로 보고되었습니다. 이는 주로 주변 온도 이하의 냉각 시스템을 제거함으로써 이루어진 결과입니다.

엔비디아는 블랙웰에 네이티브 FP4 지원을 통합하여 성능을 향상시키면서도 정확성을 유지하고 있습니다. 쿼사르 양자화 시스템은 작업 부하가 FP16과 유사한 품질을 달성하면서도 대역폭의 1/4만 사용하도록 합니다. 또한 엔비디아는 AI 도구를 활용하여 칩 설계를 개선하고 있으며, 내부 LLM을 이용해 설계, 디버깅 및 최적화를 수행하여 2080억 개의 트랜지스터를 가진 블랙웰 B200 GPU 개발에 중요한 역할을 했습니다.

이 기사는 엔비디아의 AI 로드맵에 대한 미리보기를 제공하며, 루빈 플랫폼을 포괄적인 패키지로 설명하고 블랙웰 아키텍처, 엔지니어링에서의 생성적 AI 응용 프로그램, 액체 냉각에 대한 추가 세부 사항이 다가오는 핫 칩스 회의에서 발표될 것임을 암시합니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: Nvidia (852) AI (638) Data Center (156) Blackwell (108) liquid cooling (48) NVLink (10) FP4 (6) Rubin GPUs (2) Hopper H200 (1) Vera CPUs (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.