AMD, Ryzen AI CPU 및 Radeon GPU에서 DeepSeek 실행을 위한 지침 발표

AMD는 AI 가속 Ryzen CPU와 Radeon GPU에서 DeepSeek R1 AI 모델을 실행하기 위한 상세한 지침을 발표했습니다. 이를 통해 사용자는 이 고급 사고 모델을 자신의 PC에서 로컬로 실행할 수 있습니다. 호환성은 R1을 활용하는 여러 대형 언어 모델(LLM)로 확장되며, 특히 RX 7000 시리즈 데스크탑 GPU와 XDNA NPU가 장착된 일부 Ryzen CPU와 호환됩니다. 이러한 모델을 실행하기 위해 사용자는 선택적 아드레날린 25.1.1 드라이버를 설치해야 합니다.

설치 과정은 LM Studio를 통해 간소화되며, Ryzen AI를 위해 설계된 원클릭 설치 프로그램을 제공합니다. AMD는 또한 하드웨어에서 최적의 성능을 발휘할 수 있도록 애플리케이션 조정에 대한 가이드를 제공하며, GPU와 CPU의 메모리 용량에 따라 지원되는 최대 LLM 매개변수 목록도 포함되어 있습니다.

DeepSeek R1은 최근 소비자급 하드웨어에서 작동할 수 있는 더 작고 강력한 모델로 정제되었습니다. 원래 DeepSeek-V3 모델은 2,048개의 Nvidia H800 GPU 클러스터에서 훈련되었습니다. 다양한 AMD 제품에 대한 최대 지원 매개변수는 다음과 같습니다: RX 7600 XT, 7700 XT, 7800 XT, 7900 GRE 및 7900 XT는 'DeepSeek-R1-Distill-Qwen-14B'를 처리할 수 있으며; RX 7900 XTX는 'DeepSeek-R1-Distill-Qwen-32B'를 지원합니다; RX 7600은 'DeepSeek-R1-Distill-Llama-8B'를 실행할 수 있습니다; Ryzen 8040 및 7040 시리즈 모바일 APU와 Ryzen AI HX 370 및 365는 'DeepSeek-R1-Distill-Llama-14B'를 관리할 수 있으며; Ryzen AI Max+ 395는 128GB 및 64GB 메모리 구성에서 'DeepSeek-R1-Distill-Llama-70B'를 지원하지만, 32GB에서는 'DeepSeek-R1-Distill-Qwen-32B'로 제한됩니다.

DeepSeek R1의 도입은 업계에 중요한 의미를 가지며, 주요 모델에 비해 11배 낮은 컴퓨팅 비용을 자랑합니다. 이러한 효율성은 Nvidia의 최근 시장 가치 손실 5,890억 달러에 기여했습니다. DeepSeek R1의 성능 향상은 Nvidia의 병렬 스레드 실행(PTX) 프로그래밍을 포함한 극단적인 최적화 기술 덕분입니다. 또한, DeepSeek R1은 AMD 및 Nvidia GPU에 국한되지 않으며, 화웨이도 Ascend AI GPU에 DeepSeek 지원을 통합하여 다양한 하드웨어 플랫폼에서 모델의 다재다능성을 보여주고 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

AMD, Ryzen AI CPU 및 Radeon GPU에서 DeepSeek 실행을 위한 지침 발표

댓글