중국산 DeepSeek AI 모델, 방대한 온라인 사용자 데이터 기록 및 중국 서버에 저장

전문: https://www.tomshardware.com/tech-industry/artificial-intelligence/...

원저자: Matthew Connatser | 작성일: 2025-01-28 17:41
사이트 내 게시일: 2025-01-28 22:28
DeepSeek AI 모델, 특히 그 R1 대형 언어 모델은 키 입력, 비밀번호, 생년월일 및 이메일 주소와 같은 개인 정보를 기록하는 방대한 데이터 수집 관행으로 악명을 떨치고 있습니다. 이 데이터는 중국에 위치한 서버에 저장되어 있으며, 이는 중국 정부가 민감한 정보에 접근할 가능성에 대한 개인 정보 보호 우려를 불러일으킵니다.

DeepSeek의 R1 모델은 오픈 소스이며 데이터 수집 없이 로컬에서 실행할 수 있지만, 웹사이트와 모바일 앱을 통한 온라인 접근은 회사에 의해 상당한 데이터 처리를 수반합니다. 개인정보 보호 정책에 따르면 DeepSeek는 하드웨어 관련 정보와 키 입력 패턴을 포함한 다양한 사용자 데이터를 수집하며, 이 데이터를 광고주 및 파트너에게 판매할 수 있습니다.

기술적으로 R1은 6710억 개의 매개변수를 특징으로 하며, 훈련에 필요한 GPU 시간은 280만 시간으로, 메타의 Llama 3가 3080만 시간을 소요한 것에 비해 상당히 적습니다. 이러한 효율성은 AI 시장에 영향을 미치며, DeepSeek의 데이터 관행에 대한 폭로 이후 Nvidia를 포함한 AI 주식의 최근 매도세에서 그 증거를 찾을 수 있습니다. DeepSeek의 데이터 수집 방법과 저장 위치에 대한 논란은 TikTok과 같은 다른 기술 회사들이 직면한 것과 유사한 증가된 조사의 원인이 될 수 있습니다.

* 이 글은 tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은 이곳에서 확인하실 수 있습니다.
카테고리: AI
태그: Nvidia (1549) AI (937) China (214) DeepSeek (32) Data Privacy (25) Advertising (15) user data (6) Llama 3 (4) large language model (1) R1 (1)

댓글

댓글을 쓰기 위해서는 로그인을 해 주세요.