인텔의 가우디 3는 AI 훈련 및 추론을 위해 설계된 최신 AI 칩으로, 2024년 동안 샘플링에서 생산으로 전환될 예정입니다. 2019년경부터 개발된 이 가우디의 3세대는 이전 모델들에 비해 향상된 컴퓨팅 능력, 증가된 메모리 대역폭, 그리고 더 큰 용량을 자랑합니다.
가우디 3는 두 개의 상호 연결된 컴퓨트 다이를 특징으로 하며, 각 다이는 두 개의 딥러닝 코어(DCORE), 행렬 곱셈 엔진, 16개의 텐서 프로세서 코어와 24MB의 캐시를 갖추고 있습니다. 이 아키텍처는 AI 작업에 필수적인 행렬 계산에 최적화되어 있습니다. 통합 메모리 공간은 L2, L3, HBM을 통합하여 효율적인 데이터 처리 및 관리를 가능하게 합니다.
가우디 3의 주목할 만한 점은 비디오 추론을 지원하는 것으로, HEVC, H264, JPEG, VP9와 같은 포맷을 위한 14개의 디코더를 포함하고 있습니다. 이 칩은 또한 독특한 제어 경로와 런타임 드라이버를 포함하여 운영 효율성을 향상시킵니다. 가우디 소프트웨어 스위트는 가속기 전반에 걸쳐 작업 분배를 조정하며, 병렬 처리를 위해 설계된 네트워크 온 칩(NOC)을 활용합니다.
가우디 3는 확장성을 위해 설계되었으며, RDMA 이더넷 네트워킹을 활용하여 여러 가속기를 연결할 수 있어 고성능 컴퓨팅 환경에서의 손쉬운 확장을 가능하게 합니다. 성능 벤치마크는 Llama3-8B와 같은 모델에서 지속적인 최적화를 나타내고 있습니다. 그러나 65,000개 이상의 가속기로의 실제 확장성에 대한 의문은 여전히 남아 있습니다.
생산이 증가함에 따라 가우디 3는 AI 애플리케이션에서 중요한 역할을 할 것으로 예상되며, 가까운 미래에 배포가 예상됩니다. 이 기사는 또한 2025년에 출시될 예정인 팔콘 쇼어스 아키텍처에 대한 암시를 제공하며, 인텔의 AI 칩 제공이 지속적으로 진화하고 있음을 시사합니다.
* 이 글은
servethehome.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.