앤트로픽과 메타의 성공: 수백만 권의 책을 AI 훈련에 사용하는 것이 합법일 수 있다

최근 법적 발전이 앤트로픽과 메타에게 유리하게 작용하고 있는 가운데, 한 판사가 AI 훈련에 책을 사용하는 것이 공정 사용(Fair Use)에 해당한다고 판결하여 앤트로픽에게 중요한 승리를 안겼습니다. 그러나 이 사건은 아직 초기 단계에 있으며, 여전히 처벌이 부과될 수 있습니다.

이 소송은 세 명의 작가가 앤트로픽이 수백만 권의 책을 포함한 데이터셋(Books3 및 LibGen)을 사용했다고 주장하면서 시작되었습니다. 이들 중 많은 책이 불법적으로 획득된 것으로 알려져 있습니다. 앤트로픽의 공동 창립자인 벤 만(Ben Mann)은 이러한 데이터셋을 다운로드했으며, 그 내용이 법적으로 출처가 불분명하다는 사실을 알고 있었다고 전해집니다. 이 책들은 AI 모델 훈련에 사용되었습니다.

판사인 윌리엄 알수프(William Alsup)는 AI 훈련을 '변형적(transformative)'이라고 판단했으며, 이는 공정 사용의 핵심 기준 중 하나입니다. 그는 저작권이 있는 작품을 대규모 언어 모델(LLM) 훈련에 사용하는 목적이 기존 작품을 복제하는 것이 아니라 새로운 것을 창조하는 것이라고 밝혔습니다. 이는 구글 북스(Google Books)와 같은 선례와 일치합니다.

또한, 앤트로픽은 AI 훈련을 위해 200만 권의 인쇄된 책을 법적으로 구매하고 디지털화했으며, 알수프는 이것이 공정 사용 규정을 준수한다고 판단했습니다. 그러나 이 회사는 불법 출처에서 저작권이 있는 작품을 획득한 것에 대해 조사를 받고 있으며, 이는 공정 사용의 보호를 받지 않습니다.

법률 전문가인 티모시 B. 리(Timothy B. Lee)는 이번 판결이 AI 산업에 성공적이지만, 저작권 침해에 대한 처벌이 보호된 작품당 750달러에서 3만 달러까지 다양할 수 있다고 언급했습니다. 이 사건의 결과는 향후 AI 모델이 법적으로 어떻게 훈련될지를 결정짓는 선례가 될 수 있습니다.

판결의 여파는 AI 모델이 저작권이 있는 콘텐츠를 기억하는 방식에도 영향을 미치며, 메타의 라마-3.1 모델이 해리 포터 첫 번째 책의 42%의 텍스트를 기억할 수 있다는 연구 결과가 이를 강조합니다. 이는 생성적 AI의 출력물이 원작자의 권리를 침해할 수 있는지에 대한 우려를 불러일으킵니다.

이러한 판결의 미래는 불확실하며, 또 다른 판사인 빈스 차브리아(Vince Chhabria)는 저작권이 있는 자료로 훈련하는 것의 합법성에 대해 회의적인 입장을 표명하며, 이는 권리 보유자의 비즈니스 모델을 저해할 수 있다고 제안했습니다. 이러한 판결 간의 모순은 AI 분야에서 추가적인 법적 도전으로 이어질 수 있습니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

앤트로픽과 메타의 성공: 수백만 권의 책을 AI 훈련에 사용하는 것이 합법일 수 있다

댓글