AMD는 2026년에 Nvidia의 VR200 NVL144와 경쟁하기 위해 첫 번째 랙 스케일 Instinct 가속기인 MI450X IF64와 MI450X IF128을 출시할 예정입니다. 이 가속기는 AI 배포를 위해 특별히 설계되었으며, 성공할 경우 AI 하드웨어 환경을 크게 변화시킬 수 있습니다.
현재 AMD의 MI300 시리즈 GPU는 강력하지만 Nvidia의 GB200 NVL72에 비해 성능 확장성에서 부족함을 보이고 있습니다. 다가오는 MI450X IF128은 이론적으로 72개의 GPU 패키지를 사용하는 Nvidia의 VR200 NVL144보다 우수한 성능을 발휘할 것으로 예상되지만, 그 복잡성으로 인해 초기 성공에 어려움이 있을 수 있습니다.
MI450X IF128은 Infinity Fabric를 통해 이더넷을 사용하여 두 개의 랙에서 여러 AI 프로세서를 지원하는 AMD의 첫 번째 시스템이 될 것입니다. 이 시스템은 각각 하나의 AMD EPYC 'Venice' CPU와 네 개의 MI450X GPU가 장착된 16개의 1U 서버로 구성됩니다. 128개의 GPU 각각은 GPU 간 통신을 위한 1.8 TB/s 이상의 단방향 내부 대역폭을 자랑합니다.
외부 확장 통신을 위해 이 시스템은 GPU당 최대 세 개의 800GbE Pensando 네트워크 카드를 갖추고 있어 PCIe를 통해 장치당 총 2.4 Tb/s의 아웃바운드 네트워크 대역폭을 제공합니다. 대안 구성에서는 각 GPU가 PCIe를 통해 연결된 두 개의 800GbE 네트워크 카드를 사용할 수 있습니다.
Nvidia의 GB200 시리즈가 랙 연결을 위해 능동 광케이블을 사용하는 것과 달리, AMD는 더 간단한 수동 구리 배선 방식을 사용할 예정입니다. 이는 시스템 비용과 전력 소비를 낮출 수 있지만, 신호 무결성과 케이블 길이에 대한 제한이 있을 수 있습니다.
시스템의 복잡성은 제조 및 배포에 도전 과제를 초래할 수 있습니다. 이러한 위험을 완화하기 위해 AMD는 단일 랙 내에서 운영되며 보다 예측 가능한 롤아웃을 위해 간소화된 상호 연결 설계를 갖춘 소형 버전인 MI450X IF64도 개발하고 있습니다.
AMD가 이 아키텍처를 성공적으로 구현한다면 AI 추론 시스템에서 특히 AI 컴퓨팅 시장에서의 입지를 강화할 수 있을 것으로 보이지만, Nvidia와 경쟁할 수 있는 능력은 여전히 불확실합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.