화웨이의 Ascend AI 910D 프로세서, 엔비디아의 Blackwell 및 Rubin GPU에 도전

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: | 작성일: 2025-04-29 20:07
사이트 내 게시일: 2025-04-29 22:46
화웨이의 차세대 HiSilicon Ascend 910D AI 프로세서는 엔비디아의 H100을 초월할 것으로 예상되며, 곧 테스트가 시작될 예정입니다. Ascend 910D의 초기 샘플은 5월 말까지 제공될 것으로 보이며, 화웨이는 미국의 수출 제한 속에서 국내 대안을 제공할 계획입니다. 이 회사는 중국 고객에게 이중 칩렛 구조의 Ascend 910C AI 프로세서를 대규모로 출하할 예정이며, 생산은 주로 TSMC가 제3자에게 맡길 것입니다.

현재 화웨이의 Ascend 910C는 약 780 BF16 TFLOPS의 성능을 제공하는 반면, 엔비디아의 H100은 약 2,000 BF16 TFLOPS에 달합니다. H100의 성능에 맞추기 위해 화웨이는 Ascend 910D의 내부 아키텍처를 재설계하고, 컴퓨트 칩렛의 수를 늘릴 필요가 있습니다. 내년 AI 분야에서 경쟁하기 위해서는 화웨이가 미국 AI 클러스터와 유사한 성능 수준에 도달해야 할 것입니다.

화웨이의 CloudMatrix 384 시스템은 384개의 Ascend 910C 프로세서를 탑재하고 있으며, 특정 작업 부하에서 엔비디아의 GB200 NVL72를 초월하는 성능을 보이는 것으로 알려져 있지만, 전력 소비가 더 높고 성능 대비 전력 효율이 낮습니다. 화웨이가 직면한 도전 과제는 첨단 공정 기술에 접근할 수 없는 상황에서 경쟁력을 유지하는 것입니다. 특히 엔비디아가 2026년에 약 8,300 TFLOPS의 FP8 훈련 성능을 제공할 것으로 예상되는 Rubin GPU를 출시할 준비를 하고 있습니다.

성능상의 도전에도 불구하고, Ascend 910D는 중국의 AI 훈련 환경에서 중요한 역할을 할 가능성이 높습니다. 배치된 유닛 수가 엔비디아 및 다른 경쟁자들과 비교하여 효율성 부족을 보완할 수 있을 것으로 기대됩니다. 중국의 주요 관심사는 국내 또는 해외 대리 회사를 통해 충분한 프로세서를 생산할 수 있는 능력입니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: AI
태그: Nvidia (1812) semiconductors (570) Huawei (159) HPC (144) performance comparison (54) export restrictions (30) AI processors (25) CloudMatrix (2) Ascend 910D (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.