포지트론 AI, 아틀라스 가속기가 33%의 전력으로 엔비디아 H200을 초월 — Llama 3.1 8B 모델로 사용자당 초당 280 토큰 제공

포지트론 AI가 아틀라스 가속기를 소개했습니다. 이 가속기는 엔비디아의 H200보다 AI 추론 성능에서 우수하며, 전력 소비는 단 33%에 불과합니다. 아틀라스는 2000W의 전력 한계에서 Llama 3.1 8B 모델을 사용하여 사용자당 약 280 토큰을 초당 제공할 수 있습니다. 반면, 엔비디아 DGX H200은 사용자당 약 180 토큰을 초당 제공하지만 5900W의 전력이 필요하여, 아틀라스는 성능 대비 전력 및 성능 대비 비용에서 세 배 더 효율적입니다.

포지트론 AI는 2023년에 설립되어 AI 추론 가속기에만 집중하고 있으며, 다양한 작업을 처리하는 범용 GPU와 차별화되고 있습니다. 아틀라스 시스템은 여덟 개의 Archer 가속기로 구성되어 있으며, 엔비디아의 호퍼(Hopper) 기반 시스템보다 성능이 우수하면서 전력 소비를 최소화하도록 설계되었습니다. 하드웨어는 아리조나의 TSMC Fab 21에서 제조되며, 첨단 패키징 기술을 활용하고 있으며, Hugging Face와 같은 인기 AI 도구와 호환됩니다.

회사는 최근 5160만 달러를 포함하여 7500만 달러 이상의 자금을 조달했으며, 2026년에 출시될 예정인 두 번째 세대 가속기인 아시모프(Asimov)를 개발 중입니다. 아시모프(Asimov)는 각 ASIC당 2TB의 메모리를 갖추고 있으며, 최대 16조 개의 매개변수를 지원하는 모델을 지원하여 대규모 생성 AI 애플리케이션의 기능을 향상시킬 것입니다.

AI 산업이 증가하는 전력 수요에 직면함에 따라, 포지트론 AI의 솔루션은 AI 데이터 센터의 에너지 소비에 대한 우려를 해결하는 것을 목표로 하고 있습니다. 클라우드플레어와 같은 초기 사용자가 아틀라스를 테스트하고 있으며, 주요 기술 기업들도 전력 사용을 효과적으로 관리하기 위해 자체 추론 가속기를 개발하고 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

포지트론 AI, 아틀라스 가속기가 33%의 전력으로 엔비디아 H200을 초월 — Llama 3.1 8B 모델로 사용자당 초당 280 토큰 제공

댓글