화웨이는 클라우드 서버 및 AI 가속기와 같은 기업용 애플리케이션을 위해 설계된 칩렛 기반 CPU인 쿤펑 920을 개발했습니다. 이 아키텍처는 TSMC의 7nm 공정을 활용하여 24코어 구성을 특징으로 하며, 다이 간 대역폭은 최대 400 GB/s에 달합니다. 쿤펑 920은 '레고 기반 생산' 전략을 채택하여 이중 및 쿼드 소켓 설정을 통해 유연한 구성과 확장성을 제공합니다.
쿤펑 920 내의 타이산 v110 코어는 ARM 기반으로, 적당한 재정렬 용량을 갖춘 아웃 오브 오더 실행을 지원합니다. 이 아키텍처는 공유, 개인 또는 파티션 모드에서 작동할 수 있는 동적 L3 캐시를 포함하고 있지만, 성능은 사용 패턴에 따라 크게 달라질 수 있습니다. DRAM 접근 측면에서 시스템은 듀얼 채널 DDR4-2400을 지원하며, 읽기 대역폭은 63 GB/s에 도달합니다.
경쟁사와 비교했을 때, 쿤펑 920은 칩렛 설계와 높은 다이 간 대역폭에서 강점을 보이지만, 특히 공유 모드에서 L3 캐시 성능이 저조한 문제를 겪고 있습니다. 타이산 v110 코어는 이전 ARM 설계를 능가하지만, 다양한 벤치마크에서 Arm의 네오버스 N1 및 AMD의 젠 2와 같은 최신 아키텍처에 뒤처집니다.
전반적으로 쿤펑 920은 혁신적인 기능을 도입하고 고급 제조 공정을 활용하고 있지만, 시장의 기존 플레이어들과 경쟁력 있는 성능으로 전환하는 데 어려움을 겪고 있습니다. 이 설계는 향후 개발의 기초가 될 수 있으며, 화웨이가 기술 분야에서 지속적으로 존재감을 유지하는 데 기여할 것입니다.
* 이 글은
old.chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.