최근 핵심 인재 이탈, 투자 지연, 재정 악화 등으로 험난한 여름(bumpy summer)을 보내고 있는 오픈AI가 경쟁사 보다 먼저 챗GPT 에이전트를 출시하면서 에이전트 경쟁에서 한발 앞선 행보를 선보였다.이번에 발표된 에이전트 기능은 ChatGPT의 Pro, Plus, Team 요금제 사용자에게 순차적으로 적용될 예정이다. 참고로 Pro 사용자에게는 월 최대 400개의 에이전트 프롬프트가 허용되며, Plus 및 Team 요금제 사용자는 월 40개 프롬프트로 제한된다.

챗GPT 에이전트는 기존의 'Operator'와 'Deep Research'라는 자율 에이전트에 ChatGPT의 자연어 인터페이스를 결합하여, 개인 및 업무 자동화를 지원한다. 챗GPT 에이전트는 단순한 질의응답 수준을 넘어, PPT 슬라이드 작성, 식당 예약 등 사용자를 대신해 복잡한 작업을 자동으로 수행할 것으로 기대된다. 에이전트는 내부적으로 Python 코드를 생성해 .xlsx.pptx 같은 유효한 파일을 작성하게 되고, 결과물은 Excel, LibreOffice, PowerPoint, Keynote 등 오픈 포맷을 지원하는 프로그램에서 바로 열 수 있다. 챗GPT 에이전트는 SpreadsheetBench 기준으로 ChatGPT Agent는 45.5%의 정확도를 기록하며 Copilot-in-Excel의 20%를 크게 앞선다. OpenAI는 또한 DSBench와 BrowseComp에서 새로운 최첨단 성능을 기록했다고 밝혔으며, Humanity’s Last Exam에서는 pass@1 기준 41.6%를 달성했다고 주장했다.

이제 ChatGPT는 자체 가상 컴퓨터를 활용해 웹사이트를 탐색하고, 온라인 양식을 작성하고, 데이터 리서치를 종합하는 등 일련의 작업을 처음부터 끝까지 독립적으로 수행할 수 있다. 이로써 사용자는 단순한 질문을 던지는 수준을 넘어, 실제 업무를 위임하는 ‘작업 파트너’로서 ChatGPT를 활용할 수 있게 됐다.

출처: 오픈AI 홈페이지