OpenAI는 올해 말까지 AI 서비스에 100만 개 이상의 활성 GPU를 초과할 것으로 예상되며, CEO 샘 알트만은 1억 개의 GPU라는 장기 목표를 설정했습니다. 이 목표는 미국에서 새로운 AI 인프라를 구축하는 데 초점을 맞춘 5천억 달러 규모의 프로젝트 스타게이트(Project Stargate)의 초기 예상치를 크게 초과합니다. 현재 OpenAI는 이 야심찬 목표를 달성하기 위해 9,900만 개의 GPU가 부족합니다.
프로젝트 스타게이트는 텍사스주 아빌린에 데이터 센터를 처음으로 설립하며, 올해 16,000개의 NVIDIA GB200 그레이스 블랙웰 GPU를 설치할 계획입니다. 내년 말까지 1단계는 64,000개의 GB200 GPU로 완료하는 것을 목표로 하고 있습니다. 아빌린 사이트의 장기 비전은 40만 개의 GB200 GPU로 확장하여 Oracle을 통해 NVIDIA에 약 400억 달러의 수익을 창출하는 것입니다. 이 데이터 센터는 1.2 기가와트의 전력 소비를 처리할 수 있도록 설계되었으며, 약 5,000명의 인력이 건설에 참여할 예정입니다.
OpenAI는 또한 미국의 16개 주에서 추가 스타게이트 데이터 센터를 고려하고 있으며, 기가와트 용량을 가진 5개에서 10개의 추가 센터를 계획하고 있습니다. 또한 아랍에미리트의 스타게이트 프로젝트는 5 기가와트 규모의 AI 이니셔티브를 설립할 예정입니다.
이에 비해 메타도 AI 인프라에 대규모 투자를 하고 있으며, 올해 AI 및 데이터 센터에 640억에서 720억 달러를 할당할 계획입니다. 오하이오에 위치한 그들의 Prometheus AI 훈련 클러스터는 50만 개의 NVIDIA GB200 및 GB300 GPU를 갖추고 있으며, 32억 TFLOPS의 AI 성능을 제공합니다. 메타의 CEO 마크 저커버그는 향후 5 기가와트 규모로 확장될 Hyperion 데이터 센터를 포함한 여러 다중 기가와트 데이터 센터 계획을 밝혔습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.