OpenAI 샘 알트먼 CEO가 “마치 맨해튼 프로젝트(핵무기 개발)를 보는 것 같았다”고 언급한 GPT-5는 실제로 이전 세대보다 처리 속도가 향상되고 환각(hallucination) 현상이 줄어드는 등 전반적인 성능 도약을 이뤄냈습니다. 특히 그동안 엔트로픽의 클로드보다 떨어진다고 평가받았던 코딩 능력이 좋아지면서, 프롬프트만으로 웹페이지나 간단한 게임을 만들어내는 수준에 도달한 것으로 나타났습니다. GPT-5는 업계 코딩 테스트에서 74.9%라는 정확도를 달성하며, 종전까지 최고 성능을 보였던 클로드(Claude) 모델이 기록한 67.6%를 앞질렀습니다.
또한 성능 향상과 함께 API 사용 비용은 이전 모델 대비 최대 4분의 1 수준으로 대폭 낮아져, 성능과 효율성 두 마리 토끼를 잡았다는 평가도 받았습니다. 이외에도 ‘인류 최후의 시험’이라 불리는 종합 지능 벤치마크에서도 25.3점을 기록하면서 1위에 올랐습니다.