엔비디아, 블랙웰 울트라(BLACKWELL ULTRA) B300 발표 — B200보다 1.5배 빠르고 288GB HBM3e 및 15 PFLOPS 밀집 FP4 지원

전문: https://www.tomshardware.com/pc-components/gpus/nvidia-announces-bl...

원저자: | 작성일: 2025-03-18 18:35
사이트 내 게시일: 2025-03-18 22:40
엔비디아가 블랙웰 울트라(BLACKWELL ULTRA) B300 데이터 센터 GPU를 공개했습니다. 이 GPU는 이전 B200 모델에 비해 1.5배 향상된 성능을 자랑합니다. 새로운 GPU는 288GB의 HBM3e 메모리를 탑재하고 있으며, 특히 고급 추론 작업을 위한 AI 모델의 능력을 향상시키도록 설계되었습니다. B300은 50% 더 많은 메모리와 FP4 연산을 제공하여 AI 분야에서 중요한 업그레이드로 자리매김하고 있습니다.

블랙웰 울트라(BLACKWELL ULTRA) B300은 B300 NVL16 서버 랙 및 GB300 DGX 스테이션을 포함한 다양한 구성으로 제공될 예정입니다. 전체 블랙웰 울트라(BLACKWELL ULTRA) DGX 슈퍼포드(SuperPOD)는 8개의 NV72L 랙을 사용하여 구성할 수 있으며, 288개의 그레이스(Grace) CPU, 576개의 블랙웰 울트라(BLACKWELL ULTRA) GPU, 300TB의 HBM3e 메모리를 통합하여 11.5 엑사플롭스(ExaFLOPS)의 FP4 성능을 달성합니다.

엔비디아는 밀집 FP4 연산에서 1.5배 향상을 주장하고 있지만, 다른 연산 지표가 유사하게 확장되었는지는 불확실합니다. B300은 더 많은 텐서 코어를 수용할 수 있는 더 큰 칩이 될 것으로 예상되지만, 구체적인 세부 사항은 아직 공개되지 않았습니다. 증가된 패키지 내 메모리는 더 큰 AI 모델을 지원하여 B200에 비해 계산 처리량을 크게 향상시킬 것입니다.

엔비디아는 성능 예시를 제공했지만, 호퍼(Hopper) 아키텍처와의 비교는 평가를 복잡하게 만듭니다. B300은 새로운 다이나모(Dynamo) 소프트웨어 라이브러리와 함께 사용할 경우 호퍼(Hopper) 설정보다 30배 더 많은 추론 성능을 제공할 수 있습니다. 예를 들어, 블랙웰 울트라(BLACKWELL ULTRA)는 DeepSeek R1-671B 모델을 사용하여 초당 최대 1,000개의 토큰을 처리할 수 있는 반면, 호퍼(Hopper)는 초당 100개의 토큰만 처리할 수 있어 쿼리 응답 시간이 1.5분에서 단 10초로 급격히 단축됩니다.

B300 GPU는 올해 하반기에 출하될 것으로 예상되며, 엔비디아는 이 새로운 제품 라인에서 상당한 수익 증가를 기대하고 있습니다. 이는 지난 회계 연도에 블랙웰 모델에서 얻은 110억 달러의 수익을 기반으로 하고 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: Nvidia (1661) AI (1004) Data Center (215) GPUs (56) HBM3E (42) DeepSeek (40) supercomputing (28) Blackwell Ultra (14) FP4 (7)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.