태그: real-time AI

NVIDIA는 독자적인 디코딩 알고리즘인 메두사를 도입하여 Llama 3.1 추론 성능을 크게 향상시켰으며, HGX H200 AI 가속기에서 최대 1.9배 빠른 토큰 생성을 달성했습니다. 이 발전은 대형 언어 모델(LLM)이 점점 더 복잡해짐에 …

NVIDIA는 독자적인 디코딩 알고리즘인 메두사를 도입하여 Llama 3.1 추론 성능을 크게 향상시켰으며, HGX H200 AI 가속기에서 최대 1.9배 빠른 토큰 생성을 달성했습니다. 이 발전은 대형 언어 모델(LLM)이 점점 더 복잡해짐에 …