구글은 아이언우드(Ironwood), 즉 TPU v7p를 소개하며 자사의 텐서 처리 장치(Tensor Processing Units, TPUs) 중 일곱 번째 세대를 선보였습니다. 이 새로운 칩은 구글의 비교에도 불구하고 TPU v5p의 후속작으로 주로 개발되었으며, 트릴리움(Trillium) v6e의 후속작이 아닙니다. TPU v7p는 클라우드 시스템을 위해 설계되었으며, 2017년부터 개발이 진행되어 왔습니다. 성능이 크게 향상된 이 칩은 테스트에서 TPU v2의 성능을 3,600배 향상시켰지만, FP8 지원이 이전 버전에는 없었던 점을 고려할 때 이전 모델과의 비교는 주의가 필요합니다.
TPU v7p는 칩렛(chiplet) 아키텍처를採用하여 단일 설계에서 벗어났습니다. 이 칩은 여덟 개의 HBM 모듈로 둘러싸인 두 개의 칩으로 구성되어 있으며, 훈련된 AI 모델을 활용한 추론 작업에 최적화되어 있지만 훈련도 가능합니다. 칩의 크기가 커진 것은 아마도 3nm 공정을 사용하여 생산되었음을 시사하며, 약 1,000와트의 열 설계 전력(TDP)을 나타내며, 이는 TPU v5p의 540와트에서 크게 증가한 수치입니다.
구글은 기술 세부 사항에 대해 다소 인색했지만, '트릴리움의 1.5배'와 같은 발언에서 일부 성능 지표를 추정할 수 있습니다. HBM 용량의 증가도 주목할 만하며, TPU v7p는 192GB의 용량을 자랑하는 반면, TPU v5p는 95GB에 불과합니다. 그러나 v5p에서 v7p로의 증가폭은 단지 두 배에 불과합니다. 메모리 대역폭은 트릴리움에 비해 4.5배 향상되었지만, v5p에서의 증가는 덜 두드러집니다. HBM3로의 전환이 이러한 향상에 기여할 것으로 예상됩니다.
TPU v7p는 올해 말에 출시될 예정이며, 구글은 빠른 개발 속도를 유지한다면 1년 이내에 또 다른 변형이 출시될 수 있습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.