OpenAI는 처음에 GPT-5를 표준 대형 언어 모델(LLM)의 언어 능력과 추론 모델의 논리적 강점을 결합한 하이브리드 모델로 출시할 계획이었습니다. 그러나 CEO 샘 올트먼은 GPT-5의 출시가 연기되었음을 발표했으며, 이는 연장된 개발 기간으로 인해 혜택을 볼 것으로 예상됩니다. 이 연기는 모든 원하는 기능을 단일 모델에 통합하는 복잡성 때문입니다.
그동안 OpenAI는 수요를 충족하기 위해 컴퓨팅 능력을 향상시키는 데 이 시간을 활용할 예정입니다. 특히 GPT-4에 새로운 이미지 생성기가 통합되면서 높은 서버 요구 사항과 ChatGPT 무료 버전의 일시적인 접근 제한 문제에 직면한 경험이 있습니다.
GPT-5 대신 OpenAI는 향후 몇 주 내에 추론 모델인 o3 및 o4 미니를 출시할 계획입니다. 이 모델들은 Chain-of-Thought와 같은 기술을 사용하여 작업을 단계별로 처리하고 여러 해결 경로를 탐색하며, 일부 계산을 응답 생성 중 '사고 단계'로 작용하는 추론 단계로 이동시킵니다.
GPT-5는 GPT-4.5와 같은 모델의 언어 능력과 추론 능력을 통합할 계획이었으며, 이는 구독에 따라 다양한 지능 수준을 제공하는 통합 패키지로 제공될 예정이었습니다. OpenAI는 제공되는 컴퓨팅 자원에 따라 성능을 조절하는 것을 목표로 하고 있으며, o3 모델은 이미 낮은 버전과 높은 버전 간의 차별성을 보여주어 벤치마크 성능과 운영 비용에 영향을 미치고 있습니다.
또한 OpenAI는 향후 몇 달 내에 출시될 예정인 오픈 모델을 발표했으며, 이는 GPT-2 이후 처음으로 공개 가중치 모델이 될 것입니다. 이 추론 모델은 여전히 몇 가지 도전에 직면해 있으며, OpenAI는 개발자들의 피드백을 요청하고 있습니다. 올트먼은 이 모델이 7억 명 이상의 사용자를 대상으로 하는 서비스에 대해 메타가 부과한 제한과 같은 제약이 없을 것이라고 강조했습니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.