마이크로소프트와 오픈AI, 딥시크가 ChatGPT의 데이터를 불법적으로 획득했는지 조사

마이크로소프트와 오픈AI는 중국 AI 스타트업 딥시크가 오픈AI의 API를 통해 무단으로 데이터를 접근했는지 조사하고 있습니다. 보도에 따르면, 오픈AI는 딥시크가 오픈AI의 출력을 사용하여 AI 모델을 훈련시켰다는 데이터 도난의 증거를 확보한 것으로 알려졌습니다. 이 과정은 증류(distillation)로 알려져 있습니다. 이번 조사는 딥시크가 자사의 R1 AI 모델을 출시한 이후 진행되고 있으며, 이 모델은 추론, 수학 및 일반 지식에서 주요 모델의 성능을 초과하거나 동등하다고 주장하면서도 훨씬 적은 자원을 사용한다고 합니다.

마이크로소프트의 보안 팀은 딥시크와 관련된 그룹이 오픈AI의 API에서 대량의 데이터를 추출하고 있음을 발견했으며, 이는 오픈AI의 이용 약관을 위반하는 행위입니다. 과도한 데이터 수집은 딥시크의 방법과 AI 기술 발전의 정당성에 대한 우려를 불러일으킵니다. 딥시크의 R1 모델 발표 이후, 알파벳, 마이크로소프트, 엔비디아, 오라클 등 주요 기술 기업들은 총 1조 달러에 가까운 시장 가치를 잃었으며, 이는 미국 기업의 AI 분야 지배력에 대한 투자자들의 우려를 반영합니다.

미국 정부의 AI 고문인 데이비드 색스는 딥시크가 오픈AI가 생성한 콘텐츠를 모델 훈련에 사용했다는 강력한 증거가 있다고 언급했습니다. 그러나 이 증거에 대한 구체적인 세부 사항은 공개되지 않았습니다. 오픈AI와 마이크로소프트는 현재 진행 중인 조사에 대한 공식 성명을 발표하지 않았으며, 딥시크는 논평 요청에 응답하지 않았습니다. 오픈AI는 중국 기반 기업들이 미국 기업의 모델을 증류하는 경향을 인정하고, 자사의 독점 모델을 보호하기 위한 노력을 강조했습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

마이크로소프트와 오픈AI, 딥시크가 ChatGPT의 데이터를 불법적으로 획득했는지 조사

댓글