GPT-4.5 출시: OpenAI의 가장 큰 모델이지만 추론 능력은 없음

전문: https://www.computerbase.de/news/apps/gpt-4-5-veroeffentlicht-opena...

원저자: Andreas Frischholz | 작성일: 2025-02-28 17:52
사이트 내 게시일: 2025-03-02 01:46
OpenAI는 GPT-4.5의 미리보기 버전을 출시했습니다. 이 모델은 현재까지 출시된 모델 중 가장 크며, 채팅 애플리케이션에 최적화되어 있습니다. 이전 모델들보다 더 자연스러운 느낌을 주도록 설계되었으며, 더 많은 데이터와 컴퓨팅 파워를 활용한 훈련 단계의 개선 덕분입니다. 특히 비지도 학습에서의 아키텍처 혁신과 최적화가 이루어져 패턴 인식과 창의적 통찰력 생성이 향상되었습니다.

그러나 GPT-4.5는 추론 모델이 아닙니다. OpenAI는 개발의 두 축을 구분합니다: 정확성과 세계 모델 직관을 향상시키는 비지도 학습과, 질문에 답하기 위한 인지 과정을 포함하는 추론입니다. 이로 인해 GPT-4.5는 다단계 문제 해결 및 논리 작업에서 뛰어난 성능을 보이는 o1 시리즈 및 구글의 Thinking 모델들보다 뒤처지게 됩니다.

현재 GPT-4.5는 ChatGPT Pro 사용자에게 월 200달러의 '연구 미리보기'로 제공되며, ChatGPT Plus 및 Team 사용자에 대한 접근은 곧 제공될 예정입니다. 기업 및 교육용 변형도 나중에 출시될 예정입니다. 이 모델은 웹 검색, 문서 업로드, 캔버스 인터페이스와 같은 기능을 지원하지만, 음성 및 비디오 공유와 같은 다중 모드 기능은 아직 대기 중입니다.

벤치마크 결과에 따르면, GPT-4.5는 언어 작업에서 85.1%의 성과를 기록하며 좋은 성능을 보이지만, 논리 작업에서는 36.7%의 점수로 o3-mini 모델의 87.3%에 비해 뒤처집니다. OpenAI는 GPT-4.5를 '최전선 모델'로 분류하지 않고 비지도 학습에서의 '최전선 모델'로 간주합니다. 이전 버전들에 비해 개선이 뚜렷하며, GPT-1에서 GPT-4.5로의 반복을 통해 응답이 더 세밀하고 상세해졌습니다.

특히, Anthropic은 하이브리드 추론 모델을 보유한 유일한 회사로, GPT-4.5는 추론 능력이 부족하여 이러한 능력은 GPT-5에서 도입될 것으로 예상됩니다. 이는 GPT-4.5를 논리 작업에서 전통적인 LLM 기능과 추론 장점을 결합한 Anthropic의 Claude 3.7 Sonnet보다 뒤처지게 만듭니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: AI
태그: benchmarking (273) OpenAI (143) ChatGPT (82) AI Models (22) Anthropic (10) GPT-4.5 (4) unsupervised learning (1) language processing (1) reasoning capabilities (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.