태그: Mixture-of-Experts

메타는 첫 번째 라마-4 모델인 매버릭(Maverick)과 스카우트(Scout)를 소개했습니다. 이 모델들은 매우 효율적인 다중 모달 모델로 설계되었지만, 추론 능력은 부족합니다. **라마 4 매버릭**은 총 4000억 개의 매개변수 중 170억 개의 활성 …

2025-04-06 19:21 | 댓글: 0개

DeepSeek는 6710억 개의 매개변수를 자랑하는 Mixture-of-Experts (MoE) 언어 모델을 훈련시키며 AI 분야에서 중요한 발전을 이루었습니다. 이 과정에서 2,048개의 Nvidia H800 GPU 클러스터를 약 두 달간 활용하여, Meta와 같은 업계 선두주자들에 …

2025-01-28 17:39 | 댓글: 0개

☆

중국 AI 스타트업 DeepSeek가 OpenAI, 메타, 앤트로픽과 같은 주요 기업들과 경쟁할 수 있는 AI 모델을 개발했다고 발표했습니다. 이 모델은 GPU 컴퓨팅 자원과 관련 비용을 11배 줄이는 데 성공했습니다. 이러한 주장은 …

2024-12-27 15:23 | 댓글: 0개

태그: Mixture-of-Experts

중국 AI 기업, 11배 적은 컴퓨팅으로 최첨단 AI 모델 개발 — DeepSeek의 최적화가 미국 제재의 한계를 부각시킬 수 있다 ☆ (tomshardware.com)

메타-KI: 첫 번째 라마-4 모델은 특히 효율적이지만 EU에서는 사용 불가 (computerbase.de)

DeepSeek의 AI 혁신, 업계 표준 CUDA를 우회하고 Nvidia의 어셈블리 유사 PTX 프로그래밍을 사용하다 (tomshardware.com)

중국 AI 기업, 11배 적은 컴퓨팅으로 최첨단 AI 모델 개발 — DeepSeek의 최적화가 미국 제재의 한계를 부각시킬 수 있다 ☆ (tomshardware.com)

☆

☆