AI GPU의 전력 소비가 크게 증가할 것으로 예상되며, 향후 모델은 다음 10년 동안 최대 15,360W를 소비할 가능성이 있습니다. 현재 추정에 따르면, 엔비디아의 차세대 GPU는 열 설계 전력(TDP)이 6,000W에서 9,000W 사이일 것으로 보입니다. KAIST의 전문가들은 AI GPU의 TDP가 15,360W로 증가할 것으로 예측하며, 이는 침수 냉각 및 내장 냉각 기술과 같은 고급 냉각 솔루션을 필요로 합니다.
역사적으로, 고성능 공랭 시스템은 엔비디아의 H100 AI 프로세서에 충분했습니다. 그러나 Blackwell(블랙웰) 및 Blackwell Ultra(블랙웰 울트라) 모델의 TDP가 각각 1,200W와 1,400W로 증가함에 따라 액체 냉각이 필수적이 되었습니다. 다가오는 Rubin(루빈) 및 Rubin Ultra(루빈 울트라) 모델은 각각 1,800W와 3,600W로 TDP를 끌어올릴 것으로 예상되며, 후자는 GPU 칩렛과 HBM 모듈의 수를 두 배로 늘릴 것입니다.
KAIST 연구자들은 엔비디아의 Feynman(페인먼) GPU가 약 4,400W의 열을 방출할 것으로 예상하고 있으며, 업계 소식통은 Feynman Ultra(페인먼 울트라)가 6,000W에 이를 수 있다고 전합니다. 이러한 극단적인 열 출력은 GPU-HBM 모듈이 열전달 유체에 잠기는 침수 냉각을 필요로 하며, 열 전도 경로(TTV)와 같은 혁신적인 열 방출 기술이 요구됩니다. 2032년까지 페인먼 아키텍처 이후의 모델은 TDP가 5,920W 또는 심지어 9,000W에 이를 것으로 보입니다.
컴퓨트 칩렛이 주요 전력 소비자로, HBM 스택은 16개로 증가할 것으로 예상되며, 이로 인해 메모리 전력 소비는 약 2,000W에 이를 것입니다. 2035년까지 AI GPU의 예상 전력 소비는 15,360W에 이를 수 있으며, 이는 내장 냉각 구조의 필요성을 촉발할 것입니다. 열 전송 라인(TTL) 및 유체 TSV(F-TSV)와 같은 혁신이 열 관리를 효과적으로 수행하는 데 중요할 것입니다. 2038년까지 고급 열 솔루션은 열 관리 및 신호 무결성을 향상시키기 위해 양면 인터포저 및 GPU-온-탑 아키텍처를 포함할 가능성이 높습니다.
전력 소비 증가와 고급 냉각 솔루션에 대한 이러한 추세는 AI 처리 기술의 증가하는 요구와 성능 안정성을 보장하기 위한 혁신적인 엔지니어링의 필요성을 강조합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.