엘론 머스크의 xAI 콜로서스 AI 슈퍼컴퓨터가 10만 개의 엔비디아 H100 GPU를 탑재하고 처음으로 상세히 공개되었습니다. 이 슈퍼컴퓨터는 122일의 조립 기간을 거쳐 거의 두 달 동안 운영되고 있으며, 고급 액체 냉각 시스템을 갖춘 Supermicro 서버를 사용합니다. 각 서버에는 8개의 H100 GPU가 장착되어 있으며, 전체 클러스터는 1,500개 이상의 GPU 랙으로 구성되어 있고, 200개의 배열로 조직되어 있으며, 각 서버는 초당 3.6 테라비트의 이더넷 연결을 제공합니다.
xAI 콜로서스는 현재 세계에서 가장 큰 AI 슈퍼컴퓨터로, AI 모델, 특히 Grok 3 챗봇 훈련에 전념하고 있습니다. 향후 업그레이드를 통해 GPU 용량을 5만 개의 H100 및 차세대 H200 GPU를 추가하여 두 배로 늘릴 계획이며, 이는 전력 소비를 크게 증가시킬 것입니다. 슈퍼컴퓨터의 에너지 요구는 전력 변동을 관리하기 위한 완충 장치 역할을 하는 테슬라 메가팩 배터리에 의해 지원됩니다.
콜로서스는 AI 컴퓨팅의 중요한 발전을 의미하지만, 머스크의 야심찬 AI 투자에 대한 지속 가능성에 대한 의문을 제기합니다. 특히 많은 AI 기업의 잠재적 붕괴에 대한 업계 예측을 고려할 때 더욱 그렇습니다. 이 프로젝트는 AI 기술의 상당한 도약을 반영하지만, 장기적인 생존 가능성은 여전히 불확실합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.