핫 칩스 2024에서 IBM은 차세대 텔룸 II 프로세서와 스파이레 AI 칩을 공개하며 메인프레임 기술과 AI 성능에서의 중요한 발전을 선보였습니다. 텔룸 II 프로세서는 10개의 36MB L2 캐시와 5.5GHz에서 작동하는 8개의 고정 주파수 코어를 특징으로 하며, 24 TOPS의 성능을 제공할 수 있는 온보드 AI 가속기를 포함하고 있습니다. 주목할 만한 추가 사항은 통합 데이터 처리 장치(DPU)로, 수만 개의 I/O 요청을 효율적으로 관리하며 성능과 전력 효율성을 높이기 위해 자체 L2 캐시를 포함하고 있습니다.
DPU는 PCIe Gen5 x16 인터페이스와 맞춤형 명령어 집합 아키텍처(ISA)를 갖추고 있어 전체 시스템이 여러 I/O 확장 드로어를 통해 최대 192개의 PCIe 카드를 지원할 수 있습니다. 이 아키텍처는 전력 효율성을 강조하며, 다양한 작업 부하에서 성능을 유지하기 위해 새로운 전압 제어 루프를 활용합니다.
AI 기능 측면에서 스파이레 AI 가속기 카드는 128GB의 LPDDR5 메모리를 갖추고 있으며, 단 75W의 전력으로 300 TOPS의 성능을 달성합니다. 이는 메인 프로세서의 처리 용량을 초과하는 대형 언어 모델을 위해 특별히 설계되었습니다. 스파이레 칩 자체는 32개의 코어를 포함하고 있으며, 각 코어는 2MB의 스크래치패드 메모리를 갖추고 있어 예측 및 생성 AI 애플리케이션에 최적화되어 있습니다.
IBM은 96개의 스파이레 카드가 장착된 시스템이 최대 30 페타옵스(PetaOps)의 성능을 달성할 수 있다고 주장하며, 이러한 칩의 독특한 사용 사례를 강조합니다. I/O 처리에서의 신뢰성과 성능에 대한 엔지니어링 초점은 이 분야에서의 중요한 발전입니다. 전반적으로 텔룸 II와 스파이레는 IBM이 메인프레임 및 AI 기술의 한계를 확장하려는 의지를 나타내며, 복잡한 작업 부하를 처리하기 위한 강력한 솔루션을 찾는 기업 고객에게 필수적인 구성 요소가 됩니다.
두 칩의 사양은 최첨단 설계를 드러내며, 텔룸 II는 삼성 5nm 공정을 활용하고 상당한 메모리 및 캐시 용량을 제공하는 반면, 스파이레는 효율적인 전력 소비로 고성능 AI 처리를 중점적으로 다룹니다. 이러한 혁신은 IBM을 고성능 컴퓨팅 및 AI 솔루션의 경쟁 환경에서 유리한 위치에 놓이게 합니다.
* 이 글은
servethehome.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.