이 기사는 AMD Zen 5 CPU에 대한 최근 튜닝 및 최적화가 GCC 15 컴파일러에 통합된 내용을 다룹니다. 주요 개선 사항으로는 'znver5' 타겟의 초기 튜닝이 포함되어 있으며, 이는 특정 ALU 명령어와 레지스터 간 MOV 명령어의 융합을 가능하게 하는 스케줄러 조정을 도입합니다. 이 융합은 목적지 레지스터가 일치하고 메모리 소스가 없는 특정 조건을 요구합니다. 문제 발생률은 4에서 6으로 증가했지만, 더 높은 비율은 스케줄링 문제를 초래했습니다.
또한, 재연산 폭이 6으로 업데이트되어 Zen 5 아키텍처가 3개의 ALU에서 정수 곱셈을 실행하고 개선된 대기 시간으로 부동 소수점 연산을 처리할 수 있는 능력을 반영합니다. 명령어 대기 시간도 측정 및 최적화 가이드와의 비교를 기반으로 업데이트되었으며, Zen 4와 비교했을 때 큰 변화는 없었지만, 다른 addss 명령어에 의해 공급될 경우 2 사이클 내에 실행될 수 있는 더 빠른 addss 명령어가 추가되었습니다.
이러한 최적화는 AMD의 최신 CPU 아키텍처에서 실행되는 애플리케이션의 성능과 효율성을 향상시키는 것을 목표로 하며, 다양한 작업 부하에서 더 나은 계산 결과를 이끌어낼 수 있습니다.
* 이 글은
phoronix.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.