구글의 딥마인드(DeepMind)가 2025년 처음 공개한 ‘지니 3(Genie 3)’ 월드 모델을 기반으로 한 ‘프로젝트 지니(Project Genie)’를 공식 출시했다. 프로젝트 지니는 사용자가 실시간으로 이동하고 조작할 수 있는 가상의 환경인 ‘월드 모델’을 직접 구축할 수 있으며, Genie 3와 Gemini 모델을 활용해  60초 분량의 상호작용 가능한 가상 세계를 생성할 수 있다.

사용 방법은 비교적 간단하다. 구글의 '나노 바나나 프로(Nano Banana Pro)' 모델이 구동하는 월드 스케치(World Sketching)에서 사용자가 캐릭터를 설명하고 1인칭, 3인칭, 혹은 아이소메트릭(isometric) 중 시점을 선택하면, AI는 시뮬레이션의 토대가 될 기본 이미지를 '스케치'한다. 사용자가 이 결과물의 미학적 방향을 승인하면, 지니 3 엔진이 이미지에 생명력을 불어넣어 '탐험(Exploration)'을 가능하게 한다. 영감을 얻고자 하는 이들을 위해 '리믹스(Remixing)' 기능도 제공된다. 다른 사용자가 생성한 세계를 가져와 자신만의 프롬프트로 변주함으로써, AI가 생성한 공간들을 협동적이고 진화적인 라이브러리로 만들어낼 수 있다. 참고로 지니 3는 약 110억 개의 매개변수(11B Parameters)를 보유한 기초 월드 모델(Foundation World Model)로, 시공간 비디오 토크나이저(Spatiotemporal Video Tokenizer), 자기회귀 역학 모델(Autoregressive Dynamics Model), 잠재 액션 모델(Latent Action Model)의 정교한 결합으로 구성된다. 이 모델의 특징은 명시적인 액션 라벨(Action Labels)이나 물리 엔진의 코딩 없이도 방대한 인터넷 비디오 데이터를 통해 세계의 물리적 규칙과 인과관계를 스스로 학습했다는 점이다.