전문가 평가: OpenAI의 새로운 o1 모델이 GPT-4o와 비교되는 방식

OpenAI의 새로운 o1 모델은 GPT-4o의 잠재적 후계자로 여겨지고 있으며, 전문가들은 출시 직후 초기 평가를 제공하고 있습니다. o1 모델은 특히 다단계 계획이 필요한 논리 작업에서의 이전 약점을 해결하는 것을 목표로 하고 있습니다. 와튼 스쿨의 에단 몰릭(Ethan Mollick) 교수는 o1 미리보기 버전인 스트로베리(Strawberry)가 역사적으로 대형 언어 모델(LLM)에게 도전 과제가 되었던 복잡한 문제, 예를 들어 크로스워드 퍼즐을 해결하는 데 있어 상당한 개선을 보였다고 언급했습니다. 한 사례에서 o1 모델은 크로스워드 쿼리를 처리하는 데 108초가 걸렸으며, 이는 문제를 보다 철저하게 사고할 수 있는 능력을 보여줍니다.

이러한 발전에도 불구하고 o1 모델은 여전히 GPT-4o에서도 나타나는 오류와 환각과 같은 알려진 문제를 일부 보이고 있습니다. 빅 테크놀로지의 알렉스 칸트로위츠(Alex Kantrowitz)는 글쓰기 및 마케팅 작업에 ChatGPT를 의존하는 사용자들이 처음에는 실망할 수 있지만, 수학 및 코딩에 AI를 사용하는 사용자들은 개선된 점이 더 유익할 것이라고 제안합니다. 게오르크 슈말츠리드(Georg Schmalzried)는 o1의 핵심 목표가 기존의 약점을 제거하는 것이지 현재의 강점을 강화하는 것이 아니며, GPT-4o가 자주 실패하는 단어의 글자 수를 정확히 세는 것과 같은 수치 작업에서 주목할 만한 진전을 이루었다고 강조합니다.

게리 마커스(Gary Marcus)는 GPT-4의 인상적인 측면을 인정하면서도, 틱택토(Tic-Tac-Toe)와 같은 논리 게임에서 지속적인 문제를 포함한 중요한 단점을 지적합니다. 그는 또한 OpenAI의 투명성 부족을 비판하며, 회사가 과학 커뮤니티에서 철저히 테스트할 수 있는 상세한 정보와 모델을 계속해서 공개하지 않고 있다고 언급합니다. 이러한 비밀주의는 OpenAI의 전략의 중요한 부분으로 남아 있으며, 그들의 발전에 대한 외부 검증을 제한하고 있습니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

전문가 평가: OpenAI의 새로운 o1 모델이 GPT-4o와 비교되는 방식

댓글