IBM의 Telum II는 핫 칩스 2024에서 선보인 최첨단 메인프레임 프로세서로, 금융 거래에서 높은 가동 시간과 낮은 지연 시간을 위해 설계되었습니다. 이 프로세서는 5.5 GHz에서 작동하는 8개의 코어와 360 MB의 대용량 온칩 캐시를 갖추고 있습니다. 아키텍처에는 I/O 가속을 위한 데이터 처리 유닛(Data Processing Unit, DPU)과 온보드 AI 가속기가 포함되어 있으며, 모두 삼성의 첨단 5nm 공정으로 제작되었습니다.
Telum II의 두드러진 특징은 가상 L3 및 L4 캐시 시스템을 활용한 혁신적인 캐싱 전략입니다. 이 프로세서는 10개의 36 MB L2 캐시를 자랑하며, 이는 AMD의 Zen 3와 같은 경쟁 제품의 일반적인 L3 캐시(32 MB)보다 상당히 큽니다. 이러한 설계는 메모리 접근 지연 시간을 최소화하며, Telum II는 5.28 ns의 Qualcomm Oryon 코어에 비해 3.6 ns의 L2 지연 시간을 달성합니다.
IBM의 캐시 관리 접근 방식은 데이터 중복을 줄이고 '포화 메트릭(Saturation Metric)'을 활용하여 캐시 라인 퇴출을 최적화하는 것입니다. 이를 통해 프로세서는 캐시 사용의 높은 효율성을 유지하며, 작업 부하의 요구에 따라 동적으로 적응할 수 있습니다. 가상 L3 캐시는 L2 용량에 미치는 영향을 최소화하도록 설계되어 활성 코어가 캐시 자원에 계속 접근할 수 있도록 보장합니다.
또한, Telum II는 가상 L4 캐시로 캐싱 기능을 확장하여 여러 프로세서 간에 최대 2.8 GB의 공유 메모리를 제공할 수 있습니다. 이 시스템은 최대 32개의 상호 연결된 Telum II 칩 간의 효율적인 데이터 관리를 가능하게 하지만, 이러한 연결 간의 낮은 지연 시간을 달성하는 것은 여전히 도전 과제로 남아 있습니다.
이 기사는 원래 Telum 아키텍처에서 가상 캐시 개념을 도입한 진화를 반영하며, 이전 모델에서 코어 수가 감소했음에도 불구하고 IBM이 단일 스레드 성능에 집중하고 있음을 강조합니다. 이러한 설계 철학은 캐싱 전략에 명확히 드러나며, 단일 스레드 작업 부하에 대한 낮은 지연 접근을 우선시하면서도 다중 스레드 작업도 수용할 수 있도록 하고 있습니다.
전반적으로 Telum II는 독특한 캐싱 전략과 고성능 사양으로 메인프레임 기술에서 중요한 발전을 나타내며, 기업 수준의 컴퓨팅 솔루션 시장에서 선두주자로 자리매김하고 있습니다.
* 이 글은
chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.