화웨이, Ascend AI GPU를 위한 DeepSeek 최적화 추론 지원 추가

1월 27일, 화웨이는 Ascend 데이터 센터 GPU에 최적화된 증류된 R1 AI 모델을 ModelArts Studio 플랫폼을 통해 무료로 제공한다고 발표했습니다. 화웨이는 어떤 Ascend GPU가 사용되는지 명시하지 않았지만, 업계 전문가들은 최신 Ascend 910C가 포함될 가능성이 있다고 제안합니다. 이 모델은 2023년 9월 고객에게 샘플링되었습니다.

R1 모델은 2,000대 이상의 엔비디아 H800 GPU에서 훈련되었지만, 화웨이의 GPU는 이제 LLM(대형 언어 모델)을 실행할 수 있어 엔비디아와 에이엠디와 같은 서구 기업에 대한 의존도를 줄일 수 있습니다. 진위천(Yuchen Jin)은 화웨이 910C에서의 추론 성능이 엔비디아 H100의 성능의 60%에 달하며, 수작업으로 작성된 CUNN 커널을 통해 추가 최적화가 가능하다고 언급했습니다.

엔비디아는 미국의 수출 제한으로 인해 중국에서 어려움을 겪고 있으며, 이는 고성능 프로세서의 판매를 제한합니다. R1 훈련에 사용된 H800은 금지된 H100의 대안으로 출시되었지만, 이후 제한을 받았습니다. 그 결과, 중국을 위한 엔비디아의 플래그십 H20은 H200에 비해 사양이 크게 낮아져 시장 성과에 영향을 미치고 있습니다.

Ascend 910C와 같은 현지 프로세서에서 중국 LLM을 실행할 수 있는 능력은 중국의 기술 독립을 향한 중요한 진전을 의미할 수 있습니다. Ascend GPU가 훈련과 추론을 효과적으로 처리할 수 있다면, 엔비디아의 H20에 대한 수요는 줄어들 수 있지만, 중국은 여전히 자국의 칩 제조 능력이 향상될 때까지 서구 칩에 의존하고 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

화웨이, Ascend AI GPU를 위한 DeepSeek 최적화 추론 지원 추가

댓글