태그: speculative decoding | BriefNews

태그: speculative decoding

☆

NVIDIA는 독자적인 디코딩 알고리즘인 메두사를 도입하여 Llama 3.1 추론 성능을 크게 향상시켰으며, HGX H200 AI 가속기에서 최대 1.9배 빠른 토큰 생성을 달성했습니다. 이 발전은 대형 언어 모델(LLM)이 점점 더 복잡해짐에 …

2024-09-08 09:00 | 댓글: 0개

1 / 1

AMD는 AI 기능을 향상하고 기술 프로세스를 개선하기 위해 추측적 디코딩을 사용하는 첫 번째 소형 언어 모델인 AMD-135M을 소개했습니다. 이 모델은 소형 언어 모델(SLMs)이 특정 응용 프로그램에서의 효율성으로 인정받고, GPT-4 및 …

2024-10-01 10:30 | 댓글: 0개

AMD는 AI 시장에서 경쟁하기 위한 전략의 일환으로 첫 번째 소형 언어 모델인 AMD-135M을 소개했습니다. 이 모델은 Llama 계열의 일원으로, 개인 비즈니스 배포를 위해 설계되었으며, 추론을 위해 AMD 하드웨어를 활용합니다. AMD-135M …

2024-09-30 10:54 | 댓글: 0개

☆

NVIDIA는 독자적인 디코딩 알고리즘인 메두사를 도입하여 Llama 3.1 추론 성능을 크게 향상시켰으며, HGX H200 AI 가속기에서 최대 1.9배 빠른 토큰 생성을 달성했습니다. 이 발전은 대형 언어 모델(LLM)이 점점 더 복잡해짐에 …

2024-09-08 09:00 | 댓글: 0개

1 / 1