엔비디아의 그레이스 호퍼(GH200)는 CPU와 GPU 기술의 통합에 있어 중요한 진보를 보여주며, AMD의 고성능 컴퓨팅 솔루션과 경쟁하고자 합니다. GH200은 그레이스 CPU와 최대 3.44GHz의 72개 Neoverse V2 코어, 그리고 96GB의 HBM3 메모리를 탑재한 H100 데이터센터 GPU로 구성됩니다. 이 아키텍처를 통해 서버 수준의 CPU 코어 수와 대규모 메모리 대역폭을 제공합니다. CPU 측에서는 480GB의 LPDDR5X 메모리와 384GB/s의 이론적 대역폭을 지원합니다.
시스템 아키텍처는 코어 간 연결성과 캐시 일관성, 메모리 순서를 보장하는 엔비디아의 Scalable Coherency Fabric(SCF)을 활용합니다. 하지만 NVLink C2C 인터커넥트를 통한 HBM3 메모리 접근 지연 시간이 약 800ns로 상당히 높아, AMD의 Infinity Fabric에 비해 불리한 측면이 있습니다. 반면 NVLink C2C는 900GB/s의 cross-die 대역폭을 제공하여 기존 PCIe 연결보다 월등한 성능을 보입니다.
성능 측면에서 그레이스 CPU는 병렬 컴퓨팅 응용 프로그램에 최적화되어 있지만, Graviton 4에 비해 일반 워크로드에서 성능이 떨어집니다. 그레이스의 L3 캐시 지연 시간이 특히 높아 libx264와 7-Zip 같은 워크로드에서 Graviton 4에 못 미치는 성능을 보입니다.
GH200에 통합된 H100 GPU는 SXM 버전과 유사하며 900W의 전력 한계와 개선된 VRAM 지연 시간을 가집니다. 그러나 테스트 중 PCIe 오류와 중단 이슈가 발생하여 사용자 정의 인터커넥트 검증에 어려움을 겪은 것으로 보입니다.
전반적으로 GH200은 고성능 컴퓨팅 분야에서 가능성을 보이지만, CPU-GPU 통신이 효율적인 애플리케이션 분야에서 AMD의 통합 솔루션들과 치열한 경쟁을 벌이고 있습니다. 엔비디아의 그레이스 호퍼 접근 방식은 슈퍼컴퓨팅 환경에서 성능과 효율성 향상을 위한 양사의 지속적인 노력을 보여줍니다.
* 이 글은
chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.