코텍스 A73의 제한적인 재정렬 능력

전문: https://chipsandcheese.com/2024/08/04/cortex-a73s-not-so-infinite-r...

원저자: chlamchowder | 작성일: 2024-08-04 20:53
사이트 내 게시일: 2024-08-04 21:17
코텍스 A73은 이전 Arm 64비트 코어의 전력 및 열 문제를 해결하기 위해 설계되었으며, 효율성을 우선으로 하여 스마트폰 CPU 시장에서 성공을 거두었습니다. A73의 주목할 만한 특징은 독특한 순서 바꾸기 메커니즘으로, 메모리 접근 지연을 완화할 수 있습니다. 이 아키텍처는 특히 스케줄링 용량과 미해결 분기 처리 면에서 역량을 측정하는 데 어려움이 있습니다.

A73은 순서 바꾸기 실행을 사용하여, 순서대로 작업을 가져오는 전면부와 투기적으로 처리하는 후면부로 구성됩니다. 이를 통해 CPU는 순서를 바꾸어 명령을 완료할 수 있어 성능이 향상됩니다. 그러나 A73은 분기문에 대해서는 순서를 바꿀 수 없어, 잘못된 예측으로부터 프로그램 상태를 복구해야 하는 필요 때문에 미완료 로드 앞에서만 명령을 완료할 수 있습니다.

A73의 아키텍처는 이전 세대 대비 코어 구조 크기가 크게 감소했습니다. 정수 및 부동 소수점 레지스터 파일이 분리되어 있으며, 정수는 64비트, 부동 소수점은 128비트를 지원하여 더 효율적인 면적과 전력 사용이 가능합니다. A73은 최대 66개의 명령을 동시에 처리할 수 있지만, 레지스터 파일 용량과 메모리 접근을 효과적으로 관리해야 하는 필요 때문에 제한적입니다.

메모리 접근 면에서 A73은 50개의 미완료 로드를 관리할 수 있어 이전 세대 A72의 32개 로드 큐 대비 크게 향상되었습니다. 그러나 미해결 분기 후에는 11개의 미완료 저장만 처리할 수 있어, A72보다 퇴보했습니다. 이 제한은 분기와 저장이 같은 자원을 공유하므로 명령 처리 지연이 발생할 수 있는 병목 현상을 야기합니다.

A73은 순서 바꾸기 CPU에서 일반적인 재정렬 버퍼가 없어, 재정렬 능력이 제한적입니다. 그럼에도 불구하고 특정 조건에서 최대 76개의 명령을 동시에 처리할 수 있어, 자신의 아키텍처적 제약 하에서도 여전히 우수한 성능을 발휘할 수 있습니다.

결과적으로, A73의 순서 바꾸기 완료 전략은 더 작은 코어 구조로도 경쟁력 있는 성능을 유지하고자 하는 것입니다. A57과 유사한 성능을 보이지만, 파일 압축 작업과 같은 특정 시나리오에서는 어려움을 겪습니다. A73의 낮은 전력 소모로 인해 A57의 1.8GHz 대비 2.2GHz의 더 높은 클럭 속도를 달성할 수 있으며, 이는 전체적인 성능 효율성에 기여합니다. 이 아키텍처는 더 높은 IPC가 항상 최적의 목표가 아니며, 특정 애플리케이션을 위한 코어 설계 균형이 중요하다는 것을 보여줍니다.

* 이 글은 chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: CPU
태그: Power Efficiency (92) CPU architecture (86) Arm (71) performance efficiency (2) memory access (2) Cortex A73 (1) out-of-order execution (1) register files (1) smartphone CPUs (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.