VLC 미디어 플레이어의 비영리 단체인 VideoLAN이 소프트웨어가 60억 다운로드라는 중요한 이정표에 도달했다고 발표했습니다. 이 수치는 제3자 다운로드 출처를 제외할 가능성이 있어 보수적일 수 있습니다. CES 2025에서 VideoLAN은 100개 이상의 언어에 대한 AI 기반 자막 및 실시간 번역 기능을 선보였습니다. 이 기능은 현재 개발 중이며, OpenAI의 Whisper에서 영감을 받아 오픈 소스 AI 모델을 사용하여 실시간으로 자막을 생성하는 것을 목표로 하고 있습니다. VLC의 접근 방식의 핵심은 AI 모델이 오프라인에서 작동하며 VLC 앱에 직접 내장된다는 점입니다. 이는 인터넷 연결이나 클라우드 서비스에 의존할 필요가 없어 개인 정보 보호를 중시하는 사용자에게 특히 매력적입니다. VideoLAN의 회장인 장-바티스트 켐프는 번역 및 자막 생성이 사용자 기기에서 로컬로 실행되어 개인 정보 보호와 제어를 강화한다고 강조했습니다. AI 자막 기능은 다양한 미디어 형식을 지원하여 사용자가 추가 소프트웨어 없이도 다양한 언어로 콘텐츠를 즐길 수 있는 다재다능한 도구로 VLC를 만들어 줍니다. AI는 100개 이상의 언어로 비디오에 대한 자막과 번역을 생성할 것으로 예상되어 VLC의 접근성을 전 세계적으로 확대할 것입니다. 그러나 새로운 기능의 공식 출시일이 없고 AI 생성 자막의 정확성에 대한 우려가 사용자 경험에 영향을 미칠 수 있는 잠재적인 도전 과제가 있습니다. 또한 사용될 특정 오픈 소스 AI 모델과 이 기능이 최적의 성능을 위해 전용 신경 처리 장치(NPU)를 필요로 할지에 대한 질문도 있습니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.