인텔의 Xe3 GPU 아키텍처는 회사의 그래픽 기술에서 중요한 발전을 나타내며, 하드웨어 설계가 완료되고 소프트웨어 개발이 진행 중입니다. 이 아키텍처는 GPU 구성 요소의 새로운 조직을 도입하여, 이전 세대의 4개에서 최대 16개의 Xe 코어를 가진 더 큰 렌더 슬라이스를 가능하게 합니다. 이러한 변화는 GPU의 확장성을 향상시키는 업데이트된 `sr0` 토폴로지 비트 레이아웃에 반영됩니다.
Xe3의 Xe 벡터 엔진(XVE)은 이제 10개의 스레드를 동시에 실행할 수 있으며, 이는 이전 모델의 8개에서 증가한 수치로, 스레드 수준의 병렬성과 대기 시간 숨기기를 개선합니다. 이 아키텍처는 XVE당 64KB의 레지스터 파일을 유지하지만, 더 유연한 레지스터 할당을 허용하여 간단한 셰이더와 복잡한 셰이더 모두의 성능을 향상시킵니다. 또한, Xe3는 데이터 처리를 개선하기 위한 스칼라 레지스터와 반 부동 소수점 형식 지원 및 희소 행렬 연산 최적화를 포함한 새로운 명령 기능을 도입합니다.
Xe3의 주목할 만한 기능 중 하나는 서브 삼각형 불투명 제거(Sub-Triangle Opacity Culling, STOC)로, GPU가 투명한 서브 삼각형에 대한 불필요한 셰이더 작업을 건너뛰게 하여 레이 트레이싱 성능을 향상시킵니다. 이 방법은 특히 복잡한 장면에서 성능을 최대 42.2% 향상시킬 수 있습니다. 그러나 STOC의 구현은 게임 개발자와의 협력이 필요하며, 이는 DirectX나 Vulkan과 같은 기존 그래픽 표준의 일부가 아닙니다.
전반적으로 Xe3는 인텔의 그래픽 아키텍처에서 전략적 진화를 나타내며, 대기 시간 허용성과 계산 효율성을 개선하는 것을 목표로 하고 있습니다. 스레드 관리, 레지스터 할당 및 레이 트레이싱 기능의 향상은 인텔이 GPU 시장에서 지배적인 위치를 차지하고 있는 AMD와 Nvidia와 보다 효과적으로 경쟁할 수 있도록 합니다. 인텔이 아키텍처를 계속 다듬어 나감에 따라, 다가오는 Xe3 제품은 상당한 성능 향상과 혁신적인 기능을 제공할 것으로 기대됩니다.
* 이 글은
old.chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.