엔비디아가 GeForce RTX 50 시리즈의 블랙웰 아키텍처에 대한 기술 백서를 발표했습니다. 이 백서에서는 이전 아키텍처와 비교하여 중요한 변화와 새로운 기능을 상세히 설명하고 있습니다.
백서는 57페이지에 걸쳐 있으며, 블랙웰의 혁신 깊이를 나타냅니다. 블랙웰은 차세대 AI 지원 게임 및 애플리케이션을 위해 설계되었습니다. 주요 기능으로는 신경 음영(neural shading), 에너지 효율성을 개선하기 위한 Max-Q 기능, 4세대 RT 코어, 5세대 텐서 코어, 엔비디아 DLSS 4, RTX 신경 셰이더, AI 관리 프로세서(AMP), GDDR7 메모리, 메가 지오메트리(Mega Geometry) 등이 있습니다.
주목할 만한 변화 중 하나는 스트리밍 멀티프로세서(SM)에서 블랙웰이 32개의 셰이더가 정수(INT) 또는 부동 소수점(FP) 계산을 수행할 수 있도록 허용한다는 점입니다. 이는 아다 러블레이스(Ada Lovelace)의 각 유형에 대해 16개의 셰이더로 제한되었던 것과 대조적입니다. 그러나 블랙웰은 셰이더 파티션 내에서 INT와 FP 계산을 동시에 실행할 수 있는 기능을 잃었습니다. 이 기능은 튜링(Turing)에서 도입되었습니다.
백서는 메가 지오메트리(Mega Geometry)의 중요성을 강조하며, 이는 레이 트레이싱 효과에서 저해상도 프록시의 필요성을 없앱니다. 언리얼 엔진 5의 나나이트(Nanite)와 같은 현대의 레벨 오브 디테일(LOD) 시스템은 이제 전체 세부 사항에서 레이 트레이싱 효과를 계산할 수 있습니다. 엔비디아는 파티션된 최상위 가속 구조(PTLAS)를 도입하여 전통적인 최상위 가속 구조(TLAS)의 레이 트레이싱 문제를 해결하고 있습니다.
개발자들은 NVAPI를 통해 DirectX 12를 사용하여 이러한 기능에 접근할 수 있으며, 벤더 확장을 통한 Vulkan 지원과 엔비디아의 OptiX 9.0 버전부터의 네이티브 지원도 가능합니다. 백서는 또한 자세히 다루지 않은 추가적인 변화와 혁신에 대한 힌트를 제공하며, 독자들이 블랙웰과 그 기능에 대한 포괄적인 이해를 위해 문서를 탐색할 것을 권장합니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.