태그: reinforcement learning

OpenAI는 사용자를 위해 온라인 쇼핑과 같은 작업을 자율적으로 수행할 수 있는 웹 브라우저 운영 에이전트 시스템인 오퍼레이터를 소개했습니다. 이 미리보기 버전은 현재 EU의 ChatGPT Pro 사용자에게 제공되며, 월 $200의 비용이 …

2025-03-13 16:09 | 댓글: 0개

AMD는 게임 환경, 특히 언리얼 엔진(Unreal Engine) 내에서 강화 학습(RL)을 촉진하기 위해 설계된 오픈 소스 라이브러리인 Schola 프로젝트를 소개했습니다. 이 툴킷은 개발자들이 환경을 생성하고, 에이전트를 정의하며, Gym, RLLib, Stable Baselines …

2025-02-05 16:57 | 댓글: 0개

캘리포니아 대학교 버클리 캠퍼스의 연구팀이 박사 과정 학생인 지아이 판(Jiayi Pan)의 주도로 DeepSeek의 R1-Zero 모델의 핵심 기술을 단 30달러에 성공적으로 재현했습니다. 이 성과는 고급 AI 모델이 상당히 낮은 비용으로 구현될 …

2025-01-29 15:12 | 댓글: 0개

Google이 칩 레이아웃 설계를 향상시키기 위해 설계된 강화 학습 방법인 AlphaChip을 소개했습니다. 이 기술은 전통적으로 긴 시간과 많은 노력이 필요한 칩 플로어플래닝의 시간과 비용을 크게 줄이는 것을 목표로 하고 있습니다. …

2024-09-28 13:31 | 댓글: 0개