핫 칩스 2024에서 퀄컴은 스냅드래곤 X 엘리트를 구동하는 오리온 CPU에 대한 세부 정보를 공개하며, 이로써 회사의 Arm 기반 PC 시스템 온 칩(SoC) 시장 진입을 알렸습니다. 오리온 CPU는 명령어 인출 유닛(Instruction Fetch Unit, IFU), 벡터 실행 유닛(Vector Execution Unit, VXU), 이름 변경 및 퇴출 유닛(Rename and Retire Unit, REU), 정수 실행 유닛(Integer Execution Unit, IXU), 메모리 관리 유닛(Memory Management Unit, MMU), 로드 및 스토어 유닛(Load and Store Unit, LSU) 등 여러 핵심 영역을 특징으로 합니다. CPU의 인출 및 디코드 사양은 13 사이클의 분기 예측 실패 지연(latency)을 나타내며, 퀄컴은 이를 '균형 잡힌' 설계로 설명합니다. 인출 파이프라인은 600개 이상의 항목을 포함하는 재정렬 버퍼를 포함하고 있으며, 디코더는 아키텍처의 모든 명령어 클래스를 처리할 수 있습니다.
레지스터 파일은 약 400개의 항목으로 구성되어 있으며, 정수 실행은 6폭, 벡터 실행은 4폭, 로드-스토어도 4폭입니다. 벡터 실행 측의 각 파이프는 128비트로 다양한 데이터 유형을 지원합니다. 메모리 시스템은 평균 지연 시간이 15-20 클럭인 대형 L2 캐시를 특징으로 하며, SoC의 모든 엔진에서 공유되는 상대적으로 작은 시스템 레벨 캐시인 6MB를 갖추고 있습니다. 퀄컴은 독점 및 산업 표준 프리패처(prefetcher)를 혼합하여 사용하는 프리패칭의 중요성을 강조합니다.
성능 벤치마크 결과는 퀄컴의 코어당 성능이 Arm 네오버스 N 시리즈 및 앰페어원(AmpereOne) 코어를 크게 초월함을 보여줍니다. Geekbench 6 결과는 리눅스 및 윈도우 서브시스템 포 리눅스에서 네이티브 윈도우보다 더 나은 성능을 나타냅니다. 단일 스레드의 메모리 대역폭은 100GB/s에 가까워지며, 이는 플랫폼의 LPDDR5x 메모리에서 135GB/s의 대역폭을 고려할 때 주목할 만한 수치입니다. 퀄컴은 오리온 아키텍처를 노트북을 넘어 확장할 계획이지만, 현재 서버 애플리케이션에 대한 계획은 없습니다.
이 기사는 저자의 개인적인 의견으로 마무리되며, 스냅드래곤 X 엘리트의 즉각적인 채택에 대한 회의적인 시각을 표현하고 생태계의 추가 성숙이 필요하다고 제안합니다. 흥미롭게도 발표 슬라이드에는 Arm에 대한 언급이 없으며, 이는 Arm과 퀄컴 간의 지적 재산권(IP) 유용에 관한 진행 중인 소송 때문일 수 있습니다.
* 이 글은
servethehome.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.