RDNA 4의 레이 트레이싱 개선 사항

전문: https://old.chipsandcheese.com/2025/04/14/rdna-4s-raytracing-improv...

원저자: chlamchowder | 작성일: 2025-04-14 19:12
사이트 내 게시일: 2025-04-14 22:16
이 기사는 AMD의 RDNA 4 아키텍처의 발전, 특히 레이 트레이싱 기능에 대해 다룹니다. AAA 게임에서 레이 트레이싱 효과가 점점 더 많이 채택됨에 따라 AMD는 레이 트레이싱 구현을 개선하고 있습니다. RDNA 4는 '비순차적' 메모리 접근 및 동적 레지스터 할당과 같은 기능을 도입하여 레이 트레이싱과 기타 작업 부하 모두에 이점을 제공합니다. 이 아키텍처는 고정 기능 하드웨어를 크게 개선하여 이전 세대에 비해 레이 트레이싱 성능을 향상시킵니다.

AMD는 레이 트레이싱 하드웨어를 여러 수준으로 분류하며, RDNA 4는 RT IP 3.1을 특징으로 하여 교차 테스트 처리량을 두 배로 늘리고 보다 효율적인 기하학적 표현을 위한 방향성 경계 상자(OBB)를 도입합니다. RDNA 4의 레이 가속기는 이제 두 개의 교차 엔진을 포함하여 사이클당 여덟 개의 상자 테스트 또는 두 개의 삼각형 테스트를 수행할 수 있으며, 이는 RDNA 2 및 3에 비해 상당한 개선입니다.

이 기사는 레이 트레이싱에서 경계 볼륨 계층(BVH)의 중요성을 강조하며, RDNA 4의 더 넓은 BVH와 증가된 교차 테스트 처리량이 탐색 속도를 어떻게 향상시키는지를 설명합니다. OBB의 도입은 불필요한 탐색 단계를 줄이는 데 도움이 되지만, 저장 효율성에는 타협이 있습니다. 또한 RDNA 4는 메모리 사용량을 최소화하기 위해 원시 노드 압축을 사용하여 데이터 처리를 보다 효율적으로 만듭니다.

벤치마크 결과에 따르면 RDNA 4는 레이 트레이싱 작업에서 상당한 성능 향상을 이루어내며, 초당 상자 및 삼각형 테스트 수에서 RDNA 2를 초월합니다. 예를 들어, RX 9070은 초당 111.76G의 상자 테스트와 19.61G의 삼각형 테스트를 유지하며, RX 6900XT의 38.8G 및 10.76G와 비교됩니다. 이 기사는 RDNA 4가 인상적인 발전을 이루었지만, OBB의 유연성과 캐시 크기에서 여전히 개선의 여지가 있으며, AMD의 발전을 Intel 및 NVIDIA와의 경쟁 맥락에서 위치 짓고 있음을 언급하며 마무리합니다.

* 이 글은 old.chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: GPU
태그: AMD (2146) gaming technology (181) RDNA4 (82) GPU architecture (55) Raytracing (31) Performance Benchmarking (26) Graphics Processing (16) Intersection Testing (1) Bounding Volume Hierarchy (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.