AMD는 차세대 PCIe Gen6 클러스터를 위해 설계된 Vulcano 800G NIC의 출시를 발표했으며, Pollara 400 AI NIC의 배송도 시작했습니다. Pollara 400은 400G 장치로, UltraEthernet을 활용하며 AMD의 RCCL에 최적화되어 있어 NVIDIA의 NCCL보다 확장 집합 통신에서 더 우수한 성능을 발휘한다고 보고되고 있습니다. AMD의 UEC 기능은 향상된 혼잡 제어와 부하 분산을 통해 클러스터 수준에서 성능을 개선하여, 특히 GPU와 HBM 환경에서의 신뢰성 문제를 해결할 것으로 기대됩니다.
UALink 1.0 기술은 NVIDIA의 NVLink 5.0에 대한 개방형 대안으로 자리 잡고 있으며, 다양한 공급업체의 구성 요소를 통합하면서 거의 두 배에 가까운 확장 능력을 지원한다고 주장합니다. AMD의 전략은 저비용의 일반 UEC 스위치를 사용하여 비용을 절감하면서 대규모 운영을 가능하게 하는 데 중점을 두고 있습니다. 회사는 UEC가 고급 이더넷 제품의 표준이 될 것으로 예상하고 있으며, 특히 산업이 800G 서버 및 가속기 인프라로 나아가고 있습니다.
2026년에는 AMD가 Helios Rack-Scale Architecture를 도입할 계획으로, 이는 AI 클러스터에서의 능력을 더욱 향상시킬 것입니다. ROCm에 Fabric Manager를 통합하는 것도 800G 연결을 가진 대규모 가속기 네트워크 관리를 위한 중요한 발전으로 강조되고 있습니다. NVIDIA의 ConnectX-8이 이미 출시된 상태에서, AMD의 Vulcano NIC는 개방형 생태계에 중점을 두어 NVIDIA의 보다 폐쇄적인 네트워킹 솔루션 접근 방식과 차별화된 경쟁 대안을 제공합니다.
전반적으로 AMD의 NIC 기술 및 네트워킹 표준 개발은 AI 클러스터의 미래에 매우 중요하며, 고성능 컴퓨팅 환경에서 확장 가능하고 신뢰할 수 있는 네트워킹 솔루션의 필요성을 강조하고 있습니다.
* 이 글은
servethehome.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.