Chips and Cheese에서 SPEC CPU2017 실행하기

전문: https://chipsandcheese.com/2024/09/19/running-spec-cpu2017-at-chips...

원저자: chlamchowder | 작성일: 2024-09-20 00:19
사이트 내 게시일: 2024-09-20 00:47
이 기사는 저자가 CPU 성능 측정에 중요한 SPEC CPU2017 벤치마크 스위트를 실행한 경험에 대해 다룹니다. SPEC(표준 성능 평가 협회)는 이 스위트를 제공하며, 저자는 Chips and Cheese에 부여된 무료 보도 라이선스에 대한 감사의 뜻을 전합니다. 저자는 주류 기술 사이트들이 일반적으로 벤치마킹을 다루지만, 하드웨어 아키텍처에 대한 상세한 보도가 부족하다고 느껴 SPEC CPU2017에 대한 관심을 가지게 되었다고 언급합니다.

SPEC CPU2017은 소스 코드 배포로 인해 실행하기가 어려우며, 신중한 컴파일러 선택과 최적화 플래그가 필요합니다. 저자는 GCC 14.2.0을 사용하고 `-O3` 및 `-fomit-frame-pointer`와 같은 간단한 최적화 플래그를 적용한 초기 방법론을 공유합니다. 멀티스레드 성능을 위한 여러 복사본 실행은 투자할 수 있는 시간보다 더 많은 시간이 소요되므로, 단일 스레드 결과에 집중합니다.

초기 결과에 따르면, 저자가 Ryzen 9 9950X에서 실행한 결과는 정수 및 부동 소수점 스위트에서 각각 Anandtech의 결과보다 8.6% 및 11.7% 더 높은 점수를 기록했습니다. 점수 차이는 더 빠른 메모리와 컴파일러 선택에 기인할 수 있습니다. 이 기사는 현재 소비자 CPU가 구형 모델보다 상당히 빠르며, 2006년 UltraSPARC IV+와 비교할 때 성능 개선이 10배를 초과한다고 강조합니다.

저자는 정수 및 부동 소수점 스위트 내 특정 작업 부하의 성능을 깊이 분석하며, 현대 CPU가 전반적으로 상당한 성능 향상을 보인다고 언급합니다. 다양한 작업 부하가 직면한 병목 현상을 분석하며, 특히 프론트엔드 지연 및 메모리 접근과 관련된 독특한 도전 과제를 제시하는 505.mcf 작업 부하에 주목합니다.

이 기사는 SPEC CPU2017 실행의 시간 소모적인 특성에 대한 반성과 이러한 벤치마크를 기반으로 한 향후 기사에 대한 가능성으로 마무리됩니다. 저자는 다양한 시스템 간의 비교를 용이하게 하기 위해 벤치마킹 프로세스를 간소화하고, 마이크로 벤치마크를 통해 아키텍처 세부 사항을 계속 탐구하고자 하는 열망을 표현합니다.

* 이 글은 chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: CPU
태그: benchmarking (191) Ryzen (180) CPU Performance (80) GCC (29) performance analysis (7) AnandTech (5) hardware architecture (3) SPEC CPU2017 (2) microbenchmarks (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.