OpenAI는 사용자를 위해 온라인 쇼핑과 같은 작업을 자율적으로 수행할 수 있는 웹 브라우저 운영 에이전트 시스템인 오퍼레이터를 소개했습니다. 이 미리보기 버전은 현재 EU의 ChatGPT Pro 사용자에게 제공되며, 월 $200의 비용이 발생합니다. OpenAI는 향후 Plus, Team, Enterprise 구독 사용자에게도 접근을 확대할 계획이며, 현재 독립형 도구로 운영되고 있는 에이전트를 ChatGPT에 직접 통합할 예정입니다.
오퍼레이터는 복잡한 다단계 작업을 개별 단계로 나누어 처리하도록 설계되어 AI 어시스턴트가 전체 워크플로를 맡을 수 있게 합니다. 예를 들어, 사용자가 특정 요리를 먹고 싶다고 표현하면, 오퍼레이터는 자율적으로 레시피 웹사이트에서 재료를 검색하고 식료품 소매점에서 주문할 수 있습니다. OpenAI는 인스타카트(InstaCart), Booking, Expedia, Uber, Stubhub 등 다양한 인터넷 서비스와 협력하여 이 기능을 지원하며, 사용자가 언제든지 개입할 수 있도록 하고 있습니다.
기술적으로 오퍼레이터는 컴퓨터 사용 에이전트(Computer-Using Agent, CUA)를 기반으로 하며, GPT-4o 모델의 비전 기능을 활용하고 강화 학습을 통해 추론 능력을 향상시켰습니다. CUA는 그래픽 사용자 인터페이스와 상호작용하도록 훈련되어, 특정 API 없이도 버튼, 메뉴, 텍스트 필드와 같은 표준 컨트롤을 사용할 수 있습니다. 이는 독립적으로 통합된 웹 브라우저를 통해 운영됩니다.
현재 OpenAI는 오퍼레이터를 연구 미리보기(Research Preview)로 지칭하고 있으며, 이는 여전히 테스트 단계에 있음을 나타냅니다. Reddit과 같은 플랫폼에서 사용자 보고서는 이 에이전트 시스템을 기술 데모로 묘사하며, 흥미로운 기능을 강조하지만 상당한 결함과 오류도 지적하고 있습니다.
또한 OpenAI는 광범위한 연구 보고서를 생성할 수 있는 또 다른 에이전트 시스템인 딥 리서치(Deep Research)를 보유하고 있습니다. 이 보고서의 품질은 칭찬할 만하지만, 오류와 잘못된 정보 문제는 여전히 존재하여 미세한 실수를 식별할 수 있는 지식이 있는 사용자에게만 적합합니다.
* 이 글은
computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.