카네기 멜론 대학교의 연구팀이 텍스트 입력을 기반으로 유효한 레고 디자인을 생성하는 AI 모델인 레고GPT를 개발했습니다. 이 모델은 가구, 차량, 악기 등 28,000개 이상의 독특한 3D 객체를 포함한 47,000개 이상의 레고 구조로 구성된 데이터셋을 기반으로 훈련되었습니다. 이러한 광범위한 훈련 덕분에 레고GPT는 처음부터 독창적인 디자인을 생성할 수 있어 AI 지원 디자인의 중요한 발전을 이룹니다.
레고GPT는 GitHub에서 무료로 제공되며, 컴퓨터 비전 모델과 통합할 수 있습니다. 사용자는 기존의 레고 블록을 사진으로 찍으면 AI가 사용 가능한 조각에 맞춘 다양한 건축 옵션을 제안합니다. 이 모델은 디자인 과정에서 유효성 검사와 물리 기반 롤백을 통합하여 생성된 출력이 유효하고 안정적임을 보장합니다. 즉, 겹치거나 떠 있는 블록이 없도록 합니다.
훈련에 사용된 데이터셋인 StableText2Lego는 텍스트 프롬프트를 3D 메쉬 표현으로 변환한 후, 이를 복셀 그리드로 처리하여 레고 블록의 초기 레이아웃을 결정합니다. AI는 추가할 다음 블록을 예측하여 디자인을 생성하며, 각 단계에서 유효성을 검증하고 필요시 안정적인 상태로 롤백합니다. 이 자기 회귀 방식은 최종 디자인이 실현 가능하고 인간이나 로봇이 조립할 수 있도록 보장합니다.
레고GPT의 데이터셋, 코드 및 모델의 공개는 추가 개발을 촉진하며, 사용자 맞춤형 블록 라이브러리를 갖춘 다운로드 가능한 애플리케이션으로 이어질 가능성을 열어줍니다. 이 혁신은 레고 건축에서의 창의성을 위한 새로운 가능성을 열어주며, 더 넓은 대중이 접근할 수 있도록 합니다.
* 이 글은
tomshardware.com의 기사를 요약한 것입니다. 전체 기사의 내용은
이곳에서 확인하실 수 있습니다.