최근 메사 Rusticl OpenCL 드라이버에 커널 셰이더 변형이 통합된 것은 셰이더 컴파일 성능 최적화에 있어 중요한 발전을 의미합니다. 이번 업데이트는 오프셋이 0인 경우 특히 불필요한 ALU(산술 논리 장치) 연산을 제거하여 성능을 향상시킬 수 있는 셰이더 변형의 컴파일을 가능하게 합니다.
기본적으로 드라이버는 애플리케이션에 의해 설정된 잠재적인 오프셋과 단일 커널 실행이 하나의 하드웨어 디스패치에 맞지 않을 가능성을 고려해야 합니다. 이러한 커널 런타임에서 발생하는 오버헤드를 해결하기 위해 Rusticl 드라이버는 특정 가정을 바탕으로 최적화된 커널을 컴파일하여 상당한 성능 향상을 이끌어낼 수 있습니다. 작업 그룹 크기 힌트(workgroup_size_hint)의 사용은 최적화에 추가적으로 도움을 주며, 작은 커널의 경우 명령어 수를 절반으로 줄일 수 있습니다. 이러한 발전은 상대적으로 작은 커널의 실행 속도를 크게 향상시킬 것으로 예상되며, Rusticl 드라이버가 OpenCL 작업 부하를 처리하는 데 있어 더욱 효율적이고 효과적이게 만들 것입니다.
* 이 글은
phoronix.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.