엔비디아는 자사의 AI 제품 개발을 위해 수백만 개의 동영상을 인터넷에서 수집했다는 혐의를 받고 있습니다. 익명의 전 직원에 따르면 직원들이 이러한 목적으로 동영상을 다운로드하도록 지시받았으며, 이는 윤리적이고 법적인 우려를 불러일으킵니다. 그러나 엔비디아 프로젝트 매니저들은 경영진의 승인을 받았다고 직원들을 안심시키고 있습니다.
엔비디아는 AI 시장에서 경쟁하기 위해 기반이 되는 AI 모델을 구축하고자 하며, 하루에 인간 평생에 해당하는 양의 학습 데이터를 생성할 수 있는 동영상 데이터 팩토리를 만들 계획입니다. 보고에 따르면 엔비디아는 공개적으로 이용 가능한 콘텐츠, 라이선스된 데이터, 심지어 넷플릭스의 동영상까지 다양한 출처에서 동영상을 수집했으며, 스크린 캡처 기술을 사용했다는 지적도 있습니다.
2024년 2월에 시작된 Cosmos 프로젝트는 3월까지 10만 개, 5월까지 3,850만 개의 URL을 수집했으며, 이 중 상당 부분이 영화 소스에서 가져온 것으로 알려졌습니다. 엔비디아 CEO는 기업들이 동영상 기반 기초 AI 모델을 개발해야 할 필요성을 인정했지만, 데이터 수집의 합법성과 관련된 우려가 제기되고 있습니다.
현재 AI 모델 학습을 위한 데이터 수집의 합법성을 다루는 입법 노력이 진행 중이며, 엔비디아의 행동이 기술 업계에 중요한 선례를 남길 수 있을 것으로 보입니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.