인텔, AI를 위한 가우디 3 가속기 출시: H100보다 느리지만 더 저렴

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Anton Shilov | 작성일: 2024-09-24 18:30
사이트 내 게시일: 2024-09-24 18:51
인텔이 AI 작업 부하를 위해 설계된 가우디 3 가속기를 공식 출시했습니다. 이는 엔비디아의 H100 및 H200 GPU에 대한 보다 저렴한 대안으로 자리 잡고 있습니다. 가우디 3는 64개의 텐서 프로세서 코어(TPC)와 8개의 행렬 곱셈 엔진(MME)을 갖춘 두 개의 칩렛을 특징으로 하며, 96MB의 온다이 SRAM 캐시와 19.2 TB/s의 대역폭을 제공합니다. 또한 128GB의 HBM2E 메모리를 포함하여 3.67 TB/s의 대역폭을 제공합니다.

성능 측면에서 가우디 3는 약 600W의 열 설계 전력(TDP)에서 최대 1856 BF16/FP8 행렬 TFLOPS와 28.7 BF16 벡터 TFLOPS를 제공할 수 있습니다. 그러나 엔비디아의 H100과 비교할 때 성능이 부족하며, H100은 1979 BF16 행렬 TFLOPS와 훨씬 높은 FP8 행렬 성능을 제공합니다. 이러한 낮은 성능 지표에도 불구하고 인텔은 가우디 3의 낮은 가격대를 통해 고객을 유치할 계획이며, 가속기 키트는 125,000달러에 가격이 책정되어 각 프로세서의 가격은 약 15,625달러로, H100의 가격인 30,678달러와 비교됩니다.

인텔의 가우디 3는 이전 모델인 가우디 2에서 24개의 TPC와 96GB의 HBM2E 메모리만을 갖추고 있었던 것에 비해 상당한 업그레이드를 나타냅니다. 그러나 가우디 3는 FP8 및 BFloat16 행렬 연산만을 지원하도록 작업을 단순화하여 특정 응용 프로그램에서의 다재다능성을 제한할 수 있습니다. 가우디 3의 실제 성능은 AMD의 인스팅트 MI300 시리즈 및 엔비디아의 최신 제품과 경쟁하면서 지켜봐야 할 사항입니다.

인텔은 AI 작업 부하를 위한 다양한 생태계를 제공할 계획이며, 이는 인텔의 부사장인 저스틴 호타드의 발언에서도 확인할 수 있습니다. 가우디 3 AI 가속기는 IBM 클라우드와 인텔 타이버 개발자 클라우드를 통해 제공될 예정이며, 가우디 3 기반 시스템은 올해 4분기부터 델, HPE, 슈퍼마이크로와 같은 주요 공급업체를 통해 제공될 것으로 예상됩니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: AI
태그: 인텔 (1528) Nvidia (1285) technology (1063) Performance (904) Data Center (177) pricing (32) AI accelerator (30) H100 (20) Gaudi 3 (16)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.