지난 2년 동안 큰 기대를 모아온 GPT-5가 드디어 공식 출시됐다. OpenAI의 CEO 샘 알트먼(Sam Altman)은 기자회견에서 “GPT-5는 인간이 기술과 상호작용하는 방식을 재정의할 것이다"라고 말하면서 "박사 수준의 지적 능력을 가진 GPT-5는 놀라운 멀티모달 기능으로 인공지능이 본격적으로 ‘모든 상황을 지배하는’ 새로운 시대로 진입했다"고 말했다.
이번에 출시된 GPT-5의 가장 큰 특징은 상황에 따라 여러 AI 모델이 가진 장점을 조합하여 사용할 수 있다는 점이다. GPT-5는 빠른 응답의 ‘메인 모델’(gpt-5-main), 심층 추론의 ‘사고 모델’(gpt-5-thinking), 그리고 실시간 라우팅 시스템을 통합한 ‘라우팅 시스템(routing system)’이라는 단일 플랫폼을 구현했는데 이는 작업 복잡도, 사용자 의도, 심지어 감정 피드백에 따라 컴퓨팅 자원과 모델 조합을 동적으로 배분할 수 있다.
예를 들어 사용자가 “인터랙티브 기능이 있는 3D 게임을 만들어줘”라고 입력하면, 라우팅 시스템은 0.2초 내에 프론트엔드 개발 모델을 호출해 코드 프레임워크를 생성하고, 동시에 창작 글쓰기 모듈을 활성화해 줄거리를 설계하며, 시각 인식 모델을 통해 장면을 렌더링한다. 이 모든 과정은 사용자가 도구를 직접 전환할 필요없이 진행된다. 이러한 ‘끊김없는 협업’ 능력과 멀티모달 상호작용 능력은 정보 장벽을 허물어, 텍스트·이미지·오디오·영상 간의 자연스럽고 매끄러운 정보 교환을 가능하게 한다. 심지어 영화에 대해 대화를 나눌 때, 줄거리를 정확하게 해석할 뿐 아니라 이미지 분석을 통해 비슷한 스타일의 영화를 추천하는 등 지능형 상호작용을 구현한다.
또한 기존 모델의 단점인 환각 문제를 해결하기 위해 GPT-5는 ‘세이프 컴플리션(Safe-completions)’ 메커니즘을 도입해서 기존의 이진적 ‘거부-응답’ 모델을 ‘안전 생성(safe generation)’ 연속체로 업그레이드했다. 예를 들어 사용자가 “폭죽 재료를 점화하는 방법”과 같은 위험한 질문을 하면, 시스템은 단순 거부 대신 위험 수준을 먼저 평가하고 공공 안전에 위협이 될 경우 응답을 중단하고, 학술 연구 목적이라면 제한 속도의 실험 계획과 보호 조치를 명시하여 제공한다. 이러한 계층적 처리 전략 덕분에, OpenAI의 내부 레드팀 테스트에서 GPT-5의 ‘기만적 완성’ 비율은 0.03%로, 이전 세대 대비 두 자릿수를 낮췄다.