이제 프롬프트만으로 나만의 게임을 만들 수 있다, 구글 ‘프로젝트 지니’ 출시
구글의 딥마인드(DeepMind)가 2025년 처음 공개한 ‘지니 3(Genie 3)’ 월드 모델을 기반으로 한 ‘프로젝트 지니(Project Genie)’를 공식 출시했다. 프로젝트 지니는 사용자가 실시간으로 이동하고 조작할 수 있는 가상의 환경인 ‘월드 모델’을 직접 구축할 수 있으며, Genie 3와 Gemini 모델을 활용해 60초 분량의 상호작용 가능한 가상 세계를 생성할 수 있다.
사용 방법은 비교적 간단하다. 구글의 '나노 바나나 프로(Nano Banana Pro)' 모델이 구동하는 월드 스케치(World Sketching)에서 사용자가 캐릭터를 설명하고 1인칭, 3인칭, 혹은 아이소메트릭(isometric) 중 시점을 선택하면, AI는 시뮬레이션의 토대가 될 기본 이미지를 '스케치'한다. 사용자가 이 결과물의 미학적 방향을 승인하면, 지니 3 엔진이 이미지에 생명력을 불어넣어 '탐험(Exploration)'을 가능하게 한다. 영감을 얻고자 하는 이들을 위해 '리믹스(Remixing)' 기능도 제공된다. 다른 사용자가 생성한 세계를 가져와 자신만의 프롬프트로 변주함으로써, AI가 생성한 공간들을 협동적이고 진화적인 라이브러리로 만들어낼 수 있다. 참고로 지니 3는 약 110억 개의 매개변수(11B Parameters)를 보유한 기초 월드 모델(Foundation World Model)로, 시공간 비디오 토크나이저(Spatiotemporal Video Tokenizer), 자기회귀 역학 모델(Autoregressive Dynamics Model), 잠재 액션 모델(Latent Action Model)의 정교한 결합으로 구성된다. 이 모델의 특징은 명시적인 액션 라벨(Action Labels)이나 물리 엔진의 코딩 없이도 방대한 인터넷 비디오 데이터를 통해 세계의 물리적 규칙과 인과관계를 스스로 학습했다는 점이다.
| 기술 구성 요소 | 주요 기능 및 역할 | 기술적 성취 |
| 지니 3 (Genie 3) | 기초 월드 모델로서 환경의 내부 표현 생성 및 미래 상태 예측. | 11B 파라미터 기반의 복합적 물리 시뮬레이션 및 상호작용 구현. |
| 제미나이 (Gemini) | 자연어 처리 및 고수준 추론, 사용자 의도 파악 및 환경 로직 가이드. | 상황 맥락 이해 및 복잡한 다단계 명령 수행 능력 제공. |
| 나노 바나나 프로 (Nano Banana Pro) | 초기 이미지 시드 생성 및 텍스처, 시각적 스타일 결정. | 고해상도 이미지 생성 모델과의 결합을 통한 시각적 충실도 확보. |
| TPU v5 인프라 | 실시간 월드 생성을 위한 강력한 컴퓨팅 자원 제공. | 720p 해상도에서 24 FPS의 실시간 프레임 생성 지원. |
미국에서 AI Ultra 구독자는 Google Labs에 접속해서 프로젝트로 이동하면 바로 이용 가능지만 아직 한국에서는 이용할 수 없다. 1분 미만의 짧은 러닝타임과 같이 프로젝트 지니가 가진 한계에도 불구하고 많은 투자자들은 이를 게임 개발의 미래로 상상하면서 공포에 빠졌고, 그 결과 대규모 주식 매도가 발생하면서 유니티(Unity), 테이크투 인터랙티브(Take-Two Interactive), 로블록스(Roblox) 등 주요 게임 관련 기업들의 주가가 일제히 하락했다. 특히 게임 엔진 시장의 강자인 유니티의 주가는 프로젝트 지니 발표 당일 20% 이상 폭락했는데, 이는 월드 모델이 전통적인 렌더링 파이프라인과 물리 연산 엔진을 대체할 수 있다는 공포가 반영된 결과다.
프로젝트 지니의 3가지 모델
사실 프로젝트 지니의 진정한 가치는 엔터테인먼트를 넘어 인공지능 에이전트가 현실 세계를 이해하고 행동하는 법을 배우는 '시뮬레이션 인프라'로서의 역할에 있다. 딥마인드는 지니 3를 범용 인공지능(AGI)으로 가기 위한 핵심 디딤돌로 정의하며, 이를 통해 물리적 환경에서 추론하고 문제를 해결하는 인공지능을 육성하고자 있다. 프로젝트 지니가 단순히 가상 환경만 생성하는 것이 아니라, 사용자가 그 세계를 탐험하고 상호작용할 수 있는 캐릭터까지 만들 수 있다는 점이다. 사용자는 프롬프트를 활용해 자신만의 미니 게임을 만들 수도 있으며, 키보드의 방향키로 캐릭터를 조작할 수 있다.
활용 사례는 무궁무진하다. 예를 들어 자동차 제조사들은 자율주행 차량을 안전하게 테스트하기 위한 세계를 구축할 수 있습니다. 교육 및 비디오 게임 개발 분야에서도 활용 가능성이 있다. 프로젝트 지니는 사용자가 가상 환경을 세밀하게 제어할 수 있도록 세 가지 상호작용 모델을 선보였다.
1. 월드 스케치 (World sketching)
텍스트와 생성된 이미지(또는 업로드한 이미지)를 프롬프트로 사용해 생동감 넘치게 확장되는 환경을 생성할 수 있다. 사용자가 직접 자신만의 캐릭터와 세계를 생성하고, 걷기, 라이딩, 비행, 운전 등 탐험 방식을 자유롭게 정의할 수 있다. 구글 딥마인드는 보다 정밀한 제어를 위해 '월드 스케치' 기능을 나노 바나나 프로와 통합했다. 이를 통해 세계가 어떤 모습일지 미리 확인하고, 본격적으로 시작하기 앞서 이미지를 수정해 세계를 세밀하게 조정할 수 있다. 또한 1인칭 또는 3인칭 등 캐릭터의 시점을 정의해, 장면을 경험하는 방식을 미리 설정할 수도 있다.
2. 월드 탐험 (World exploration)
이용자는 생성된 세계 속에서 어디든 자유롭게 이동하며 탐험할 수 있다. 이용자가 움직이면, 프로젝트 지니는 이들의 행동을 기반으로 향후 경로를 실시간으로 생성한다. 또한 생성된 세계를 가로질러 이동하는 동안 카메라 앵글을 조정할 수도 있다.
3. 월드 리믹스 (World remixing)
갤러리나 <랜덤 추첨 아이콘(randomizer icon)>이 추천해주는 다른 사용자가 만든 세계에서 영감을 얻거나, 그 결과물 위에 자신만의 새로운 아이디어를 쌓아 올릴 수도 있다. 작업을 마친 후에는 자신이 만든 세계와 탐험 과정을 영상으로 다운로드할 수 있다.
시뮬레이션과 소프트웨어의 차이
구글은 프로젝트 지니의 정체성에 대해 오해가 없도록 주의를 기울이고 있다. 구글은 관련 문서에서 "지니 3는 게임 엔진이 아니다"라고 명시했다. 전통적인 비디오 게임은 하드코딩된 로직과 미리 렌더링된 에셋(asset)에 의존한다. 반면, 프로젝트 지니는 순수한 통계적 추론을 통해 물리 법칙과 움직임을 예측한다. 결과물은 비디오 게임처럼 보일지 모르지만, 전통적인 게임 메커니즘이나 승패 조건은 존재하지 않는다. 기술적인 제약도 남아 있다. 프로젝트 지니는 현재 시뮬레이션은 60초, 해상도는 720p, 프레임 속도는 초당 24프레임으로 제한된다.
이러한 한계에도 불구하고 분석가들은 이번 출시를 중요한 이정표로 평가한다. 딥마인드가 수년간 쌓아온 기초 연구가 어떻게 'AI Ultra' 시대의 상품으로 연결되는지를 보여주는 가장 가시적인 증거이기 때문이다. 이 서비스는 디지털 콘텐츠가 단순히 소비되는 것을 넘어, 실시간으로 꿈꿔온 대로 실체화되는 미래를 엿볼 기회를 제공한다.
지니 3가 열어젖힌 '환각의 물리학' 시대
프로젝트 지니는 가상 세계가 기하학적 연산이 아닌 확률적 예측에 의해 구축되는 새로운 시대를 열었다. 이는 콘텐츠 제작의 효율성을 극단적으로 높이는 동시에, 인공지능이 물리적 현실을 이해하고 행동하는 '피지컬 AI'의 탄생을 앞당기는 촉매제가 될 것이다. 게임 산업은 이제 AI를 단순한 도구가 아닌 "상상의 물리 엔진"으로 받아들여야 하며, 영화와 건축 등 창의적 전문직은 AI가 제안하는 수많은 변수 속에서 최종적인 가치를 결정하는 '디렉터'로서의 역량을 키워야 한다.
저작권 분쟁과 기술적 비용 문제는 여전한 풀어야 할 숙제이지만, 지니 3가 보여준 "텍스트로 세계를 창조하는" 능력은 인류가 가상 현실과 상호작용하는 방식에 있어 되돌릴 수 없는 거대한 진보임이 분명하다. 딥마인드의 행보는 결국 AGI를 향한 긴 여정에서 새로운 변곡점으로 기록될 것이다.
글: 투이컨설팅 디지털연구소