구글은 새로운 AI 모델을 빠르게 출시하고 있으며, 제미니 2.5 프로를 소개했습니다. 이 새로운 추론 모델은 구글의 벤치마크에 따르면 OpenAI의 o3-mini 모델과 같은 경쟁자들을 크게 능가합니다.
기술적으로 제미니 2.5 프로는 최근 공개된 제미니 2.0 플래시 사고를 기반으로 하고 있습니다. 이 모델은 강화 학습(Reinforcement Learning)과 사고의 연쇄(Chain of Thought)와 같은 고급 기술을 사용하며, 크게 개선된 기본 모델과 최적화된 후속 훈련 과정을 통해 혜택을 보고 있습니다.
구글은 이러한 추론 기능을 모든 미래 모델에 통합할 계획입니다. 계산은 추론 단계로 이동하여 모델이 쿼리 후 '사고 과정'을 시작할 수 있도록 하며, 작업을 여러 단계로 나누고 다양한 솔루션을 탐색할 수 있게 합니다. 이 접근 방식은 수학 및 코딩과 같은 분야에서 특히 유리하며, 에이전트 작업에도 도움이 될 것으로 예상됩니다.
벤치마크 테스트에서 제미니 2.5 프로는 놀라운 성능 향상을 보여주었으며, 현재 추론 및 다양한 코딩 벤치마크에서 1위를 차지하고 있습니다. LMArena 리더보드에서도 1위를 기록하고 있습니다.
직접적인 경쟁자로는 OpenAI의 o3-mini, Claude 3.7 Sonnet, Grok 3 Beta와 같은 시장의 다른 추론 모델이 있으며, 구글의 벤치마크에 따르면 딥시크 R1은 뒤처져 있습니다. 특히 GPT-4.5는 추론 능력이 부족하지만 글쓰기 작업에서는 뛰어난 성능을 보입니다. 구글이 선택한 벤치마크 테스트는 주로 추론 및 코딩에 중점을 두고 있습니다.
제미니 2.5 프로는 구글 AI 스튜디오를 통해 제공되며, 제미니 고급 구독자에게도 이용 가능합니다. 반면, 제미니 앱의 표준 버전 사용자들은 여전히 모든 사용자에게 제공되는 o3/딥시크 응답으로 제미니 2.0 플래시 사고 추론 모델에 접근할 수 있으며, 이는 2월에 도입되었습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.