엘론 머스크의 ‘콜로서스(Colossus)’ 슈퍼컴퓨터, 10만 개 H100 NVIDIA GPU로 가동 시작, H200 업그레이드 곧 진행 예정

전문: https://wccftech.com/elon-colossus-supercomputer-nvidia-h100-h200-g...

원저자: Sarfraz Khan | 작성일: 2024-09-04 13:30
사이트 내 게시일: 2024-09-04 13:57
엘론 머스크의 xAI가 10만 개의 NVIDIA H100 GPU로 운영되는 콜로서스(Colossus) 슈퍼컴퓨터를 출시했습니다. 이는 전 세계에서 가장 큰 AI 훈련 시스템으로 자리 잡았습니다. 이 프로젝트는 단 122일 만에 완료되었으며, 5만 개의 H200 GPU를 추가하여 용량을 20만 개로 두 배 늘리는 업그레이드가 계획되어 있습니다. H200 GPU는 생성적 AI 및 고성능 컴퓨팅(HPC)을 위해 45% 더 높은 계산 성능을 제공할 것으로 예상됩니다.

콜로서스(Colossus) 슈퍼컴퓨터는 H100 GPU에 액체 냉각을 사용하며, 더 강력한 H200 GPU에도 유사한 냉각 솔루션이 필요합니다. H200 GPU는 H100보다 300W 더 많은 전력을 소모하며, 메모리 용량이 61GB 더 많고 메모리 대역폭은 4.8TB/s로 H100의 3.35TB/s와 비교해 향상된 사양을 자랑합니다.

현재 콜로서스(Colossus)는 9만 개의 GPU를 보유한 구글(Google) AI와 8만 개의 GPU를 보유한 오픈AI(OpenAI)를 초월하고 있습니다. 이 발전은 xAI가 오라클의 서버에서 전환한 이후 이루어진 것으로, AI 훈련 시스템의 성능과 능력에서 중요한 도약을 의미합니다. 콜로서스(Colossus)는 12월까지 가장 강력한 AI가 될 것을 목표로 하는 GROK 3의 개발을 지원할 예정입니다.

* 이 글은 wccftech.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: AI
태그: Nvidia (1674) high-performance computing (204) Elon Musk (91) liquid cooling (74) xAI (37) AI training (33) supercomputer (30) H100 (21) H200 (11)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.