하이드라 호스트가 설계한 144개의 엔비디아 H200 AI GPU를 갖춘 Exacluster의 상세 정보

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Anton Shilov | 작성일: 2025-01-31 20:00
사이트 내 게시일: 2025-01-31 22:24
하이드라 호스트가 설계한 Exacluster는 18개의 레노버 노드에 걸쳐 144개의 엔비디아 H200 GPU를 탑재하여 AI 애플리케이션을 위한 570 FP8 페타TOPS의 컴퓨팅 성능을 제공합니다. 각 노드는 20TB의 HBM3E 메모리를 장착하고 있으며, 16개의 노드는 훈련에 최적화되어 있고 2개는 추론에 사용됩니다. 이 클러스터는 동서 트래픽을 위한 3.2Tbps 인피니밴드와 남북 통신을 위한 400Gbps 이더넷을 활용한 고성능 네트워킹 아키텍처로 지원되어 엔비디아의 참조 아키텍처와의 원활한 호환성을 보장합니다.

Exacluster는 192개의 96코어 프로세서(총 3,456코어), 36TB의 DDR5 메모리, 270TB의 NVMe 스토리지를 포함한 인상적인 사양을 자랑하며, 확장 가능한 스토리지 옵션도 제공합니다. Exacluster의 총 비용은 500만 달러로, 기계당 평균 277,777달러로, 단일 8웨이 H200 베이스보드와 비교할 때 경쟁력 있는 가격입니다. 하이드라 호스트는 엔비디아와의 긴밀한 파트너십을 통해 잠재적인 우대 가격을 제공하여 고객에게 더 큰 가치를 제공합니다.

하이드라 호스트의 브로크르 플랫폼은 GPU 프로비저닝, 관리 및 원격 임대를 용이하게 하여 클러스터의 활용도를 최적화합니다. 이 플랫폼은 베어 메탈 프로비저닝 및 라이프사이클 관리를 자동화하여 유휴 시간을 크게 줄이고 배달 프로세스를 간소화합니다. 이러한 혁신적인 접근 방식은 대량 구매를 통해 더 나은 가격을 제공함으로써 스타트업에 이익을 주는 동시에 사용하지 않는 서버의 수익화를 가능하게 하여 AI 컴퓨팅 환경에서 다재다능한 솔루션이 됩니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: high-performance computing (193) Lenovo (107) supercomputing (25) AI Computing (14) NVIDIA H200 (4) GPU cluster (2) Hydra Host (1) Brokkr platform (1) networking architecture (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.