메타, 100,000개 이상의 NVIDIA H100 AI GPU를 사용해 Llama-4 훈련 — 마크 저커버그는 Llama 4가 “내가 본 것 중 가장 큰 클러스터”에서 훈련되고 있다고 밝혀

메타는 100,000개 이상의 NVIDIA H100 AI GPU를 활용하여 Llama-4 모델을 훈련하고 있으며, 이는 AI 훈련 능력의 중요한 발전을 의미합니다. 마크 저커버그는 이 클러스터가 업계의 다른 클러스터와 비교할 때 전례 없는 규모라고 강조했습니다. Llama-4의 구체적인 기능은 공개되지 않았지만, 새로운 모달리티, 향상된 추론 능력, 개선된 속도를 특징으로 할 것으로 예상됩니다.

이 발전은 메타를 마이크로소프트, 구글, 일론 머스크의 xAI와 같은 기술 대기업들과 직접 경쟁하게 만듭니다. 이들 모두 AI에 대규모로 투자하고 있습니다. 특히 머스크는 비슷한 규모의 클러스터를 이전에 구축했으며, 이를 200,000개의 GPU로 확장할 계획을 세웠습니다. 그러나 메타는 2024년 말까지 50만 개 이상의 H100 동급 GPU를 보유할 야심찬 계획을 세우고 있어 AI 훈련을 위한 강력한 인프라를 구축하고 있습니다.

Llama-4의 오픈 소스 접근 방식은 연구자와 조직이 모델을 자유롭게 활용할 수 있도록 하여, API로 제한된 OpenAI의 GPT-4 및 구글의 제미니와 같은 독점 모델과 대조됩니다. 그러나 메타는 상업적 사용 및 훈련 투명성에 대한 특정 제한을 두고 있어, 이는 채택에 영향을 미칠 수 있습니다.

이러한 대규모 GPU 클러스터의 전력 소비는 상당한 우려를 불러일으킵니다. 단일 AI GPU는 연간 최대 3.7 MWh를 소비할 수 있으며, 100,000개 GPU 클러스터의 연간 소비량은 약 370 GWh로, 이는 3,400만 가구 이상의 평균 미국 가정을 전력 공급할 수 있는 양입니다. 이러한 막대한 전력 수요는 지속 가능한 에너지 공급에 도전 과제를 제기하며, 저커버그는 전력 제약이 AI 성장에 장애가 될 수 있음을 인정했습니다.

이러한 도전에 대응하기 위해 마이크로소프트와 구글과 같은 경쟁자들은 전력 수요를 충족하기 위해 원자력 에너지 솔루션을 탐색하고 있습니다. 이러한 이니셔티브는 시행하는 데 시간이 걸릴 수 있지만, AI 인프라를 위한 지속 가능한 에너지 공급원으로의 전략적 전환을 나타냅니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

메타, 100,000개 이상의 NVIDIA H100 AI GPU를 사용해 Llama-4 훈련 — 마크 저커버그는 Llama 4가 “내가 본 것 중 가장 큰 클러스터”에서 훈련되고 있다고 밝혀

댓글