라마 훈련: 메타는 저작권 경고가 제거된 이유를 설명해야 합니다

메타는 현재 AI 모델 라마(Llama) 훈련 데이터에서 저작권 정보를 제거한 혐의를 받고 있습니다. 법원은 이제 이 회사에 대한 이러한 주장에 응답할 것을 명령했습니다.

이 명령은 2023년 7월 저자 리차드 카드리(Richard Kadrey), 사라 실버맨(Sarah Silverman), 크리스토퍼 골든(Christopher Golden)이 제기한 집단 소송에 의해 발행되었습니다. 그들은 메타가 자신의 작품을 불법적으로 사용하여 AI 모델을 훈련했다고 주장하고 있습니다. 올해 초, 그들은 메타가 의도적으로 저작권이 있는 콘텐츠를 사용했다는 주장을 포함하도록 소송을 확대했습니다. 이 콘텐츠는 저작권 관리 정보(CMI)가 포함되어 있었으며, 저자, 라이센스, 사용 조건 및 생성 날짜가 명시되어 있었다고 전해집니다. 메타는 기계 학습을 위해 이 정보를 파일에서 제거한 것으로 알려져 있습니다.

지난주, 차브리아(Vince Chhabria) 판사는 소송의 확대를 허용하며 메타가 미국 디지털 밀레니엄 저작권법(DMCA)을 위반했다는 주장을 포함하도록 지시했습니다. 공개된 법원 문서에 따르면, 메타는 이미 보호된 자료가 포함된 데이터셋 "Books3"를 라마 1 언어 모델 훈련에 사용했다고 인정했습니다. 차브리아 판사는 "원고의 주장은 메타가 CMI를 제거하여 라마가 CMI를 출력하지 않도록 하고, 따라서 저작권이 있는 자료로 훈련되었음을 드러내지 않으려 했다는 것을 시사합니다."라고 언급했습니다.

이 소송의 수용은 AI 회사들이 신경망 훈련을 위해 저작권이 있는 작품을 무분별하게 사용하는 것이 재정적 결과를 초래할 수 있음을 나타냅니다. 그러나 원고들은 또한 좌절을 겪었습니다. 차브리아 판사는 메타가 피어 투 피어 토렌트를 통해 얻은 비허가 도서 사용이 캘리포니아 종합 컴퓨터 데이터 접근 및 사기법(CDAFA)을 위반했다는 주장을 기각했습니다.

그럼에도 불구하고 원고들은 유리한 판결을 받을 기회를 여전히 가지고 있습니다. 지난달, 미디어 회사 톰슨 로이터(Thomson Reuters)는 현재 파산한 AI 회사 로스 인텔리전스(Ross Intelligence)에 대해 부분 판결을 확보했으며, 이는 잠재적 책임을 회피하기 위해 공정 사용을 주장하는 것을 금지했습니다. 이 판결은 다른 AI 관련 법적 분쟁에 대한 선례가 될 수 있습니다. 또한, 소송을 제기한 저자들은 이러한 대결에 익숙하며, 지난해 1월 오픈AI(OpenAI)를 상대로 자신들의 작품을 불법적으로 사용하여 GPT 언어 모델을 훈련했다고 주장하며 승리를 거둔 바 있습니다.

* 이 글은 computerbase.de의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.

라마 훈련: 메타는 저작권 경고가 제거된 이유를 설명해야 합니다

댓글