NVIDIA는 이전에 출시된 Grace Hopper(GH) 슈퍼칩을 기반으로 하는 Grace Blackwell(GB) 슈퍼칩을 소개했습니다. GB 슈퍼칩은 CPU와 GPU가 내부 독점 칩 간 캐시 일관성 인터커넥트를 통해 메모리를 공유할 수 있도록 하는 캐시 일관성 접근 시스템을 특징으로 합니다.
현재 nvgrace-gpu 드라이버는 GH 장치를 관리하고 있으며, 새로운 Grace Blackwell 보드에 대한 지원을 확장할 계획입니다. GH 시스템의 하드웨어 결함은 다중 인스턴스 GPU(MIG) 기능에 영향을 미쳐, 1G의 장치 메모리 세그먼트를 분할하고 비캐시로 매핑해야 했습니다. 이 세그먼트는 문제를 해결하기 위해 가짜 기본 주소 레지스터(BAR)로 표현됩니다.
GB 시스템은 이 결함을 해결하여 GPU Direct RDMA 기능을 지원하는 사용 가능한 BAR1(영역 2 및 3으로 구성)을 제공합니다. nvgrace-gpu 드라이버의 패치 시리즈는 이전에 사용된 가짜 BAR 대신 실제 물리적 장치 BAR1을 가상 머신(VM)에 제공하여 이러한 변경 사항을 수용합니다. 이 조정은 두 시스템 간의 불일치를 해결하여 GB 슈퍼칩 사용자에게 기능성과 성능을 향상시킵니다.
* 이 글은
phoronix.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.