AMD의 Advancing AI 2025 행사에서 CDNA4 아키텍처를 기반으로 한 MI350 시리즈 가속기가 공개되었습니다. AMD의 수석 인스턴트 설계자인 앨런 스미스는 MI350이 HPC(고성능 컴퓨팅) 및 AI 작업 부하에 최적화된 GFX9 아키텍처를 기반으로 하고 있다고 설명했습니다. MI350 시리즈는 MI300 시리즈의 64킬로바이트에서 160킬로바이트로 로컬 데이터 저장소(LDS) 용량을 증가시켰으며, 성능 향상을 위해 대역폭을 두 배로 늘렸습니다.
MI350의 주요 혁신 중 하나는 FP8, FP6 및 FP4 데이터 유형에 대한 마이크로스케일링 형식의 도입으로, FP6는 FP4와 동일한 처리량을 달성합니다. 이러한 설계 선택은 AI 추론 및 훈련을 위한 업계 최고의 성능을 제공하기 위한 것입니다. MI350 시리즈는 TF32에 대한 하드웨어 수준의 가속을 포함하지 않고, 대신 대부분의 모델에 대해 더 높은 처리량을 제공하는 BF16을 선택했습니다.
MI350의 컴퓨트 다이는 TSMC의 N3P 공정으로 제조되며, 컴퓨트 유닛 수가 40개에서 36개로 줄어들어 텐서 연산의 효율성을 높이기 위해 32개의 활성 컴퓨트 유닛을 지원합니다. I/O 다이는 N6 공정에서 유지되며, 고급 기술의 혜택을 덜 받습니다. MI350은 HBM3E 메모리를 위해 설계되어 MI300의 5.2-5.6 Gbps에서 8 Gbps로 대역폭을 증가시켜 데이터 전송 시 전력 소비를 최적화합니다.
MI350x의 전력 소비는 1000와트이며, MI355x는 1400와트에 달해 공기 및 액체 냉각 옵션을 포함한 고급 열 관리 솔루션이 필요합니다. 전반적으로 MI350 시리즈는 AI 및 HPC 애플리케이션을 위한 높은 성능을 제공하면서도 효율성과 비용 효과성을 유지하는 아키텍처를 목표로 하고 있습니다.
* 이 글은
old.chipsandcheese.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.