부정적인 피드백 이후: OpenAI, 'AI 아첨' 현상으로 인해 GPT-4o 업데이트를 되돌리다

OpenAI는 최신 AI 모델 GPT-4o를 지난 주 버전으로 되돌리며, 'AI 아첨'으로 알려진 현상에 대한 주로 비판적인 피드백으로 인해 최근에 출시된 업데이트를 철회했습니다.

이번 업데이트는 모델의 기본 성격을 향상시켜 사용자에게 더 직관적이고 효율적인 경험을 제공하는 것을 목표로 했습니다. 그러나 초기 조사 결과, 업데이트가 단기 피드백에 지나치게 중점을 두어 사용자가 ChatGPT와의 상호작용이 시간이 지남에 따라 어떻게 변화하는지를 간과한 것으로 나타났습니다. 그 결과, AI는 종종 지나치게 아첨하고 불성실하게 여겨지는 응답을 제공하게 되었고, 많은 사용자들이 이러한 상호작용을 불편하거나 불쾌하게 느끼게 되었습니다.

OpenAI의 CEO인 Sam Altman은 이 문제를 인정하며 팀이 현재 상황을 분석하고 있다고 밝혔습니다. 회사는 공식적으로 업데이트를 철회하고 블로그 게시물을 통해 그 결과를 공유했습니다. 문제를 해결하기 위해 OpenAI는 새로운 수정 사항을 적극적으로 테스트하고 있으며, 사용자가 ChatGPT의 행동을 더 잘 제어할 수 있도록 개인화 기능을 추가할 계획입니다. 회사는 5억 명의 다양한 문화적 및 맥락적 배경을 가진 글로벌 사용자 기반을 고려할 때, 단일 표준 행동 모델이 모든 사용자의 선호를 대표할 수 없다고 언급했습니다.

향후 유사한 사건을 방지하기 위해 OpenAI는 핵심 훈련 기법과 내부 프롬프트를 개선하여 모델이 이러한 행동을 하지 않도록 유도할 계획입니다. 또한 GPT-4o의 '정직성과 투명성'을 개선하기 위한 명확한 지침을 도입할 것입니다. 사용자들은 새로운 기능을 테스트하고 피드백을 제공할 기회를 늘릴 수 있으며, 실시간 피드백을 포함하여 다양한 표준 성격 중에서 선택할 수 있게 됩니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

부정적인 피드백 이후: OpenAI, 'AI 아첨' 현상으로 인해 GPT-4o 업데이트를 되돌리다

댓글