중국의 x86 CPU 설계업체인 자오신(Zhaoxin)이 최신 CPU인 카이시안(KaiXian) KX-7000을 공개했습니다. 이 CPU는 "世纪大道" (세기 대로, Century Avenue)라는 새로운 아키텍처를 특징으로 하며, 이전 모델인 KX-6640MA의 성능 부족 문제를 해결하는 것을 목표로 하고 있습니다. KX-6640MA는 구식의 2-wide 코어 설계와 3 GHz 미만의 클럭 속도로 인해 현대 애플리케이션에서 어려움을 겪었습니다. KX-7000은 3.2 GHz의 클럭 속도를 가진 4-wide, AVX2 지원 코어를 자랑하며, KX-6640MA의 2.6 GHz보다 상당히 빠릅니다. 이 CPU는 x86-64 소프트웨어 생태계를 효과적으로 활용하도록 설계되었습니다.
KX-7000은 8개의 세기 대로(Century Avenue) 코어를 특징으로 하며, 32 MB의 L3 캐시를 공유하고 AMD의 라이젠 프로세서와 유사한 칩렛 설계를 사용합니다. 자오신은 KX-7000이 3.5-3.7 GHz의 클럭 속도에 도달할 수 있다고 주장하지만, 실제로는 3.2 GHz를 초과하는 경우는 관찰되지 않았습니다. 이 아키텍처는 64 KB의 명령 캐시를 갖춘 전통적인 프론트엔드 설정을 포함하고 있지만, 코드가 L3 캐시로 넘어갈 때 대역폭 제한으로 인해 1사이클당 4바이트 미만으로 떨어질 수 있는 문제가 있습니다.
성능 측면에서 KX-7000은 SPEC CPU2017의 정수 벤치마크에서 48.8% 향상을 보였으며, 부동 소수점 벤치마크에서는 루자이즈이(LuJiaZui) 대비 2배 이상의 속도 향상을 기록했습니다. 그러나 정수 성능에서는 AMD의 불도저(Bulldozer)에 비해 13.6% 부족하며, 부동 소수점 성능에서는 10.4% 우수합니다. KX-7000의 멀티스레드 성능은 혼합된 결과를 보이며, 8개의 코어가 일부 작업 부하에서 이점을 제공하지만 불도저(Bulldozer)나 인텔의 스카이레이크(Skylake)와 같은 구형 아키텍처를 일관되게 초과하기에는 부족합니다.
KX-7000의 메모리 서브시스템은 심각한 문제를 안고 있으며, 특히 작은 페이지 크기를 사용할 때 DRAM 성능이 저조하고 지연 시간이 높습니다. 메모리 컨트롤러는 최적의 속도를 달성하는 데 어려움을 겪고 있으며, 이론적인 대역폭은 25.6 GB/s로 제한되며, 실제 읽기 대역폭은 종종 12 GB/s 이하로 떨어집니다. 이러한 부족함은 아키텍처가 높은 부하에서 코어 간의 공정성을 관리하지 못해 지연 시간이 증가하는 문제를 더욱 악화시킵니다.
전반적으로 KX-7000은 자오신에게 있어 주목할 만한 진전을 나타내지만, AMD의 불도저(Bulldozer)와 비교할 때 성능 수준을 달성했음에도 불구하고 AMD, 인텔 또는 Arm의 현대 CPU들이 가진 정교함과 균형이 부족합니다. 캐시 대역폭, 메모리 성능 및 프론트엔드 효율성에서의 아키텍처의 한계는 국내 시장의 요구를 충족할 수 있지만, 글로벌 시장에서 효과적으로 경쟁하기에는 부족할 것으로 보입니다.
* 이 글은
old.chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.