MLPerf 훈련 벤치마크: 엔비디아가 블랙웰로 시장을 장악하는 동안 AMD와 인텔은 침묵을 지키다

전문: https://www.computerbase.de/news/wirtschaft/mlperf-training-benchma...

원저자: Volker Rißka | 작성일: 2024-11-13 16:00
사이트 내 게시일: 2024-11-13 16:18
최신 MLPerf 훈련 벤치마크는 엔비디아의 새로운 블랙웰(Blackwell) 아키텍처가 훈련 작업에서 경쟁사들을 크게 능가하며 지배적인 위치를 차지하고 있음을 보여줍니다. 엔비디아의 DGX B200 플랫폼은 LLM 사전 훈련 및 미세 조정 벤치마크에서 GPU당 성능이 두 배 이상 향상되었으며, 특히 GPT-3 175B 및 Llama 2 70B 모델에 대해 두드러진 성과를 보였습니다. 이는 이전 모델에 비해 상당한 도약을 의미하며, 엔비디아의 시장 선두를 더욱 공고히 하고 있습니다.

반면, AMD와 인텔은 이러한 벤치마크에 대한 결과를 제출하지 않았습니다. AMD는 자사의 인스팅트(Instinct) 솔루션 최적화에 집중하고 있으며 훈련 벤치마크 제출을 연기했다고 밝혔습니다. 인스팅트 MI325X는 제한된 기능으로 출시되었고, MI355X는 2025년에 출시될 예정입니다. 인텔은 한편으로 자사의 가우디(Gaudi) 아키텍처에 대한 수익 목표를 달성하지 못할 것이라고 인정했으며, 이는 가우디 2에서 가우디 3로의 전환과 소프트웨어 사용성 문제로 인해 채택 속도가 느려졌기 때문입니다.

구글의 트릴리움(Trillium) TPU도 등장하여 이전 제출에 비해 GPT-3 모델의 성능이 3.8배 향상되었음을 보여주었습니다. 그러나 올해 초 발표된 이론적 성능 향상에는 아직 도달하지 못했습니다. 트릴리움 클러스터는 97.6%의 인상적인 스케일링 효율성을 보여주며 향후 최적화 가능성이 높음을 나타냈습니다.

전반적으로 엔비디아의 지속적인 소프트웨어 개선과 성능 향상은 AMD와 인텔과 같은 경쟁자들이 제품 전환과 시장 채택에 어려움을 겪고 있어 따라잡기 점점 더 어려워지고 있습니다. AI 훈련 솔루션의 시장은 엔비디아에 유리하게 크게 기울어져 있으며, 블랙웰(Blackwell) 아키텍처는 성능과 효율성의 높은 기준을 설정하고 있습니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: AMD (1411) 인텔 (1343) Nvidia (922) Blackwell (115) Machine Learning (114) AI training (28) Performance Benchmarking (20) MLPerf (11) TPU (7) Google Trillium (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.