오픈AI의 반격! 챗GPT 에이전트로 업무 자동화 지원한다

최근 핵심 인재 이탈, 투자 지연, 재정 악화 등으로 험난한 여름(bumpy summer)을 보내고 있는 오픈AI가 경쟁사 보다 먼저 챗GPT 에이전트를 출시하면서 에이전트 경쟁에서 한발 앞선 행보를 선보였다.이번에 발표된 에이전트 기능은 ChatGPT의 Pro, Plus, Team 요금제 사용자에게 순차적으로 적용될 예정이다. 참고로 Pro 사용자에게는 월 최대 400개의 에이전트 프롬프트가 허용되며, Plus 및 Team 요금제 사용자는 월 40개 프롬프트로 제한된다.

챗GPT 에이전트는 기존의 'Operator'와 'Deep Research'라는 자율 에이전트에 ChatGPT의 자연어 인터페이스를 결합하여, 개인 및 업무 자동화를 지원한다. 챗GPT 에이전트는 단순한 질의응답 수준을 넘어, PPT 슬라이드 작성, 식당 예약 등 사용자를 대신해 복잡한 작업을 자동으로 수행할 것으로 기대된다. 에이전트는 내부적으로 Python 코드를 생성해 .xlsx와 .pptx 같은 유효한 파일을 작성하게 되고, 결과물은 Excel, LibreOffice, PowerPoint, Keynote 등 오픈 포맷을 지원하는 프로그램에서 바로 열 수 있다. 챗GPT 에이전트는 SpreadsheetBench 기준으로 ChatGPT Agent는 45.5%의 정확도를 기록하며 Copilot-in-Excel의 20%를 크게 앞선다. OpenAI는 또한 DSBench와 BrowseComp에서 새로운 최첨단 성능을 기록했다고 밝혔으며, Humanity’s Last Exam에서는 pass@1 기준 41.6%를 달성했다고 주장했다.

이제 ChatGPT는 자체 가상 컴퓨터를 활용해 웹사이트를 탐색하고, 온라인 양식을 작성하고, 데이터 리서치를 종합하는 등 일련의 작업을 처음부터 끝까지 독립적으로 수행할 수 있다. 이로써 사용자는 단순한 질문을 던지는 수준을 넘어, 실제 업무를 위임하는 ‘작업 파트너’로서 ChatGPT를 활용할 수 있게 됐다.

출처: 오픈AI 홈페이지

작업형 에이전트로의 진화하는 ChatGPT

OpenAI는 ChatGPT에 새로운 에이전트 기능을 통합함으로써, 사용자의 요청을 단순히 이해하는 수준을 넘어서 직접 실행하는 AI 비서로 전환시키고 있다. 이 기능은 자체 가상 컴퓨터를 기반으로 하며, 사용자의 명령을 받아 복합적인 온라인 작업을 처리할 수 있다.

예를 들어 사용자는 “다음 주 클라이언트 미팅을 위해 해당 기업의 관련 뉴스와 미팅 포인트를 정리해줘”라는 지시를 내릴 수 있으며, ChatGPT는 달력을 확인하고, 웹에서 최신 뉴스를 수집·요약하고, 핵심 내용을 정리해 슬라이드 형태로 제공할 수 있다. 또한, '4인 가족을 위한 한식 아침 식사를 계획하고 재료를 구매해줘', '3개의 경쟁사를 분석하고 프레젠테이션 슬라이드를 만들어줘' 같은 요청을 처리할 수 있다.

새로운 에이전트는 단순한 웹 인터페이스를 넘어서 다양한 작업 도구를 활용할 수 있도록 설계되었다. 사용자는 GUI(그래픽 사용자 인터페이스)를 통해 웹사이트를 직접 브라우징하거나, 텍스트 기반 브라우저를 통해 빠른 정보 검색을 진행할 수 있다. 또한, 금융 정보, 스포츠 점수 등은 API를 통해 즉시 접근 가능하다. 이러한 복합 도구들은 ChatGPT가 작업을 보다 빠르고 정확하게 수행할 수 있게 해 주며, 동일한 대화 흐름 내에서 대화형 요청에서 실행형 작업으로 자연스럽게 전환할 수 있는 유연성을 제공한다.

중요한 점은 모든 과정에서 사용자가 언제든 개입하고 제어할 수 있다는 점이다. ChatGPT는 작업을 진행하기 전 권한을 요청하며, 사용자가 직접 로그인하거나 특정 작업을 승인할 수 있도록 안내한다. 작업 중에도 사용자는 방향을 수정하거나 세부 지시를 추가할 수 있으며, 필요시 작업을 중단하고 현재까지의 결과만 받아볼 수도 있다. 예를 들어, ChatGPT가 여러 기업의 재무 데이터를 추출해 보고서를 작성하고 있을 때, 사용자는 "경쟁사 A와 B만 따로 비교 분석해줘"라고 요청할 수 있고, ChatGPT는 중단 없이 새로운 지시에 따라 다시 작업을 이어간다. 이런 방식은 반복적이고 협업적인 업무 흐름에 최적화되어 있다.

하지만 ChatGPT 에이전트를 실제 사용해본 결과 아직은 아쉽다는 평가도 있다. ZDNet의 초기 테스트에서는 8개의 복잡한 작업 중 단 1건만이 오류 없이 완료되었고, The Information은 사람이라면 15분 만에 끝낼 작업을 30분 넘게 기다렸다는 테스트 사용자의 증언을 전했. OpenAI 역시, ChatGPT 에이전트가 여러 도구를 병행하여 사용할 때 오류 가능성 증가와 속도 저하 위험이 있다고 경고하고 있어 실제 업무에서 사용가능한 에이전트 수준은 GPT-5에서 가능할 것으로 예상된다.

본격적인 ‘인간 - AI 협업 시대’의 도래

앞으로 이러한 에이전트 기능은 기업의 업무 자동화, 데이터 리서치, 클라이언트 대응, 교육 콘텐츠 작성 등 광범위한 영역에 걸쳐 활용될 것으로 기대된다. OpenAI는 향후 반복적이고 중대한 개선을 통해 ChatGPT 에이전트를 더 많은 사용자가 손쉽게 사용할 수 있도록 지원할 계획이다.

ChatGPT의 다음 진화는 단순히 “대답하는 AI”를 넘어, "실행하는 동료이자 파트너"로서 우리 곁에 다가오고 있다. 예를 들어, AI가 데이터 분석과 초안 작성을 맡고, 인간 팀원들은 그 결과를 바탕으로 심층 토론, 창의적 아이디어 발상, 최종 전략 결정을 내리는 방식으로 회의를 운영할 수 있다.

미국의 씽크탱크인 브루킹스 연구진들은 실제 전문가가 참여한 팀 대화의 전사 내용을 AI 모델에 입력했을 때, 더 높은 품질의 결과물이 생성된다고 조언한다. 이러한 연구결과는 인간과 AI 도구가 상호 보완적으로 작용할 수 있으며, 양자를 결합했을 때 최상의 결과가 도출될 수 있다는 점을 시사한다. 앞으로 챗GPT 에이전트가 기업에서 어떻게 활용될지 관심을 가지고 지켜봐야겠다.

글: 투이컨설팅 디지털연구소