유럽의 선도적인 AI 개발사인 미스트랄 AI가 첫 번째 추론 모델인 마그스트랄을 출시했습니다. 이 모델은 240억 개의 매개변수를 가진 오픈 소스 버전인 마그스트랄 스몰과 기업을 위한 더 강력한 마그스트랄 미디엄 두 가지 변형으로 제공됩니다. 그러나 이 모델들의 성능은 미스트랄 AI가 제공한 벤치마크에 따르면 중급 범주로 분류됩니다.
AIME 2024 수학 벤치마크에서 마그스트랄 미디엄은 64회 테스트에서 73%와 90%의 점수를 기록했으며, 마그스트랄 스몰은 70.7%와 83.3%의 점수를 기록했습니다. GPQA 다이아몬드 및 라이브 코드 벤치마크와 같은 다른 테스트에서도 성능은 유사하게 나타났습니다. 비교적으로, 마그스트랄 미디엄의 성능은 1월에 출시된 초기 딥시크-R1 모델과 비슷하지만, 업데이트된 딥시크-R1, OpenAI의 o3, 구글의 제미니 2.5 프로에는 미치지 못합니다.
미스트랄의 추론 모델은 논리 작업에 최적화되어 있으며, 계산의 일부를 추론 단계로 이동시켜 사용자 입력 후 '사고 과정'을 가능하게 합니다. 이 회사는 영어, 프랑스어, 스페인어, 독일어, 이탈리아어, 아랍어, 러시아어 및 간체 중국어에서 강력한 성능을 주장하며 언어 능력을 강조합니다. 또한, 미스트랄의 챗봇인 르 샤에서 제공하는 플래시 답변 모드는 많은 경쟁자들보다 10배 빠른 속도로 토큰을 처리하여 추론 모델에서도 실시간 답변을 가능하게 합니다.
마그스트랄 스몰은 허깅페이스와 같은 플랫폼에서 오픈 웨이트 모델로 다운로드할 수 있으며, 마그스트랄 미디엄의 미리보기는 르 샤 챗봇과 API를 통해 접근할 수 있습니다. 현재 추론 모델은 논리 작업에 있어 최첨단으로 간주되며, 산업 트렌드와 일치하지만, 그 이점의 범위는 AI 연구에서 논란의 여지가 있는 주제로, 최근 애플의 연구에서 퍼즐 해결 작업에서의 추론 모델의 한계가 강조되었습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.