AI 챗봇과의 심리상담, 치료개선 효과는?

사람들은 생성 AI를 얼마나 많이 사용하고 있을까? 데이터 플랫폼 기업 아이지에이웍스가 발표한 모바일인덱스 리포트에 따르면 2025년 2월 기준 생성 AI 앱 국내 사용자 수 1위는 챗GPT로 387만명이 이용하고 있는 것으로 나타났다. 또한 챗GPT는 1인당 월 평균 사용 시간은 77분으로 2위를 차지했다. 월 평균 사용 시간 1위는 305분을 기록한 뤼튼이 차지했다. 뤼튼의 사용 시간이 월등하게 많은 이유는 이용자가 직접 제작하거나 이미 만들어진 AI 페르소나와 대화하는 서비스인 ‘캐릭터챗’ 의 인기 때문인 것으로 추정된다.  

이처럼 많은 사용자들이 생성 AI 서비스를 더 많이, 더 오래 사용하는 것으로 나타나면서 챗GPT를 나만의 전문상담사로 활용하는 경우도 조사됐다. 그렇다면 챗GPT와 같은 AI 챗봇에 나만의 고민을 상담하는 것이 과연 효과적일까? 정답은 "그렇다"이다.

Therabot 애플리케이션의 주요 설계 특징, 출처: Dartmouth 대학교

심리상담 AI챗봇, Therabot의 등장

미국 다트머스대학교 연구진은 생성 AI 기반 멘탈 치료 챗봇인 'Therabot'에 대한 임상 시험 결과를 NEJM(The New England Journal of Medicine) AI에 발표하고 결론적으로 환자들이 Therabot을 신뢰할 수 있고 의사소통이 가능하다고 평가했다. (제목: Randomized Trial of a Generative AI Chatbot for Mental Health Treatment)

주요 연구진: Geisel School of Medicine professors Michael Heinz, Nicholas Jacobson, 출처: Dartmouth 대학교

전 세계적으로 정신건강 질환의 유병률이 증가하고 정신건강 서비스에 대한 수요가 급증하면서 기존 의료 시스템은 상당한 부담을 안고 있다. 이러한 맥락에서 인공지능(AI) 챗봇은 전통적인 정신 건강 지원 방식을 보완하거나 대체할 수 있는 유망한 대안으로 부상했다.

이번 임상 시험에는 우울장애, 범불안장애, 섭식장애 진단을 받은 미국인 106명이 참여했으며 참가자들은 스마트폰 앱을 통해 자신의 감정에 관한 질문에 답하거나 대화를 개시하는 방식으로 Therabot과 상호 작용했다. 참고로 Therabot은 다트머스대학 제이콥슨 AI 및 정신 건강 연구소에서 개발되었으며, Dartmouth Health 소속 심리학자 및 정신과 의사들이 참여해 지속적으로 성능을 향상시켰다.

그 결과 우울증 진단을 받은 사람들은 증상이 평균 51% 감소해 임상적으로 유의미한 개선을 보였고, 범불안장애 참가자들은 평균 31% 증상 감소가 보고됐다. 이들 중 다수는 중등도 불안에서 경도 불안으로, 또는 경도 불안에서 진단 임계치 이하로 옮겨갔다. 또한 전통적으로 치료가 더 까다로운 섭식장애 위험군에서도 Therabot 사용자들은 신체 및 체중에 대한 걱정이 평균 19% 감소했다.

우울증 51% 감소, 범불안장애 31% 감소, 섭식장애 19% 감소에 대한 설명, 출처: Dartmouth 대학교

Therabot 사용자들은 모두 이전에 정신건강 장애 진단을 받은 사람들로, 8주 후에 증상에 상당한 개선을 경험했다. 사람들이 앱으로 대화를 시작하면 Therabot은 연구진이 현재의 증거 기반 최적 심리 치료 및 인지 행동 치료 관행에서 개발한 원래 학습 데이터를 기반으로 자연스럽고 개방적인 텍스트 대화로 응답한다.

예를 들어, 불안 증상이 있는 사람이 "최근에 매우 불안하고 압도당하는 느낌이 든다"라고 Therabot에게 말하면, Therabot은 "한 걸음 물러서서 왜 그렇게 느끼는지 물어봅시다"라고 제시한다. 만약 Therabot이 사용자 대화 중에 자살 충동과 같은 고위험 콘텐츠를 감지하면, 화면속 911 버튼을 눌러서 전화하거나 자살 예방 핫라인에 연락하라는 메시지를 제공한다.

연구진들은 AI 기반 치료가 여전히 임상 전문가의 감독이 필요하지만, 정신건강 전문의가 턱없이 부족한 현실을 감안할 때 이들을 쉽게 만날 수 없는 다수에게는 유용할 수 있다고 결론지었다. 가이젤 의과대학 생물의료 데이터 과학 및 정신의학 교수인 니콜라스 제이콥슨(Nicholas Jacobson)은 “미국에서는 임상 전문의 1명당 우울증이나 불안장애 환자 수가 평균 1,600명에 달하고 있다. 이번 연구를 통해 우리가 관찰한 AI 챗봇을 통한 증상 개선 정도는 전통적 외래 치료에서 보고되는 수준과 비슷해, Therabot과 같은 AI 챗봇을 통한 보조 접근법이 임상적으로 의미있는 이익을 줄 수 있음을 시사한다.”고 말했다.

그렇다면 앞으로 정신적 문제가 있는 환자들을 전적으로 AI 챗봇에게 맡겨도 될까? 연구진들은 해당 시스템의 개발 및 임상 시험은 안전성, 효능 및 참여의 어조에 대한 엄격한 기준을 가져야 하며, 정신 건강 전문가의 긴밀한 감독과 참여를 포함해야 한다고 조언한다. 또한 상담 도중 환자가 자살 충동과 같은 급성 안전 문제를 표현하거나, 소프트웨어가 최적의 관행과 일치하지 않는 방식으로 응답하는 경우 사람이 즉시 개입해야 한다고 전했다.

심리상담 AI 챗봇의 향후 방향

최근 의학 저널 및 논문 분석 결과, AI 챗봇은 정신 건강 관리 분야에서 상당한 잠재력을 보여주고 있다. 단기적으로 우울증, 불안, 섭식 장애 등의 증상 완화에 효과적이며, 사용자들은 긍정적인 경험과 치료적 관계 형성 가능성을 보여주고 있다。이처럼 AI 챗봇은 접근성, 확장성, 비용 효율성 측면에서 전통적인 치료의 한계를 극복하고 정신 건강 서비스에 대한 장벽을 낮출 수 있는 매력적인 도구이다. 하지만 전문가들은 AI 챗봇의 한계점과 잠재적인 위험성을 간과해서는 안된다고 경고하고 있다. 진정한 공감 부족, 오진 가능성, 과도한 의존 위험, 위기 상황 대처 미흡, 데이터 프라이버시 문제, 알고리즘 편향성, 책임 소재 불분명 등 해결해야 할 윤리적 및 안전성 문제가 여전히 존재하기 때문이다.

따라서 AI 챗봇을 정신 건강 관리에 책임감 있고 윤리적으로 구현하기 위해서는 신중한 접근 방식이 필요하다. 장기적인 효과와 안전성을 검증하기 위한 지속적인 연구, 다양한 인구 집단을 위한 맞춤형 안전 프로토콜 개발, 기존 의료 시스템과의 효과적인 통합 방안 모색, 그리고 윤리적 문제 및 규제 프레임워크 마련이 필수적이다. AI 챗봇은 전통적인 정신 건강 관리를 대체하기보다는 보완적인 도구로서 활용될 때 가장 큰 효과를 발휘할 수 있다. 인간 치료사의 전문성과 AI 챗봇의 접근성 및 효율성을 결합한 통합 또는 하이브리드 모델은 미래 정신 건강 관리의 중요한 방향이 될 수 있을 것이다。

글: 투이컨설팅 디지털연구소