구글의 GameNGen 프로젝트는 신경망과 안정적 확산 기술을 활용하여 원본 *둠* 게임 플레이를 생성할 수 있는 AI 기반 게임 엔진을 소개합니다. 다니 발레프스키, 야니브 레비아탄, 모압 아라르, 그리고 슐로미 프루흐터를 포함한 연구팀은 GameNGen이 이전 프레임과 현재 플레이어 입력을 처리하여 인상적인 시각적 충실도와 일관성을 가진 새로운 프레임을 생성하도록 설계했습니다.
GameNGen의 *둠*은 전통적인 비디오 게임처럼 플레이할 수 있으며, 플레이어는 회전하고, 측면 이동하며, 무기를 발사하고, 실시간으로 레벨 생성 경험을 할 수 있습니다. 이 게임은 20 FPS로 작동하여 짧은 클립에서 실제 *둠* 게임 플레이와 구별하기 어렵습니다. AI를 훈련하기 위해 팀은 다양한 플레이어 기술 수준과 난이도를 시뮬레이션하고, 파워업을 수집하는 행동에는 보상을 주고, 플레이어의 피해나 사망에는 패널티를 부여하여 수백 시간의 시각적 훈련 데이터를 생성했습니다.
이 연구에서 주목할 만한 혁신은 안정적 확산을 사용하여 장시간 게임 플레이 동안 프레임 일관성을 유지하는 것입니다. 일반적으로 안정적 확산은 시간에 따라 일관성과 시각적 충실도에서 어려움을 겪습니다. 구글 리서치는 사용자 입력과 이전 프레임의 긴 시퀀스를 사용하여 새로운 프레임을 훈련시키고, 가우시안 노이즈를 추가하여 맥락 프레임의 정확성을 향상시킴으로써 이러한 문제를 해결했습니다. 이 방법은 자기 수정 이미지와 높은 시각적 안정성을 보장합니다.
진전을 이루었음에도 불구하고 GameNGen의 출력물은 결함이 없지 않습니다. 무작위 블롭, 흐릿한 적, 일관성 없는 레벨 레이아웃과 같은 문제가 여전히 존재합니다. 완전한 플레이 가능한 게임을 생성하지는 않지만, GameNGen은 AI 생성 게임의 중요한 진전을 나타내며, 미래의 AI 게임 개발에 영향을 미칠 가능성이 있습니다. 이는 칼텍의 마인크래프트에서의 일관된 맵 생성 연구와 같은 다른 연구와 함께 진행되고 있습니다. 이 기술의 함의는 AI 기반 비디오 게임 엔진이 가까운 미래에 더 보편화될 수 있음을 시사합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.