AI 저작권 소송, 무임 승차인가? 공정 이용인가?

최근 AI 기업과 콘텐츠 기업간 저작권 분쟁 사례가 급증하고 있습니다. OpenAI, 메타, 마이크로소프트, 구글, 엔트로픽 등 대부분의 AI 기업들이 수십건에 달하는 법적 분쟁에 휘말렸는데요. 그중 엔트로픽은 자사의 AI 모델 학습을 위해 작가들의 저작물을 무단 도용했다는 이유로 제기된 집단소송에 대해 무려 15억 달러에 합의한 것으로 알려졌습니다.

소송을 제기한 콘텐츠 기업들은 AI 기업들이 자사의 콘텐츠를 저작권자의 승인이나 보상 없이 무단으로 사용해서 거대 언어모델을 구축한 행위를 “무임승차에 의한 도용”으로 규정한 반면, AI 기업들은 미국 저작권법의 공정 이용(fair use) 원칙을 내세워, 공개된 웹상의 데이터를 활용했기 때문에 합법적이라고 항변하고 있습니다.

국내에서도 AI와 콘텐츠 기업간 충돌 가능성이 대두되고 있습니다. 2025년 1월, 한국방송협회가 네이버를 상대로 방송뉴스 기사 무단학습에 대한 저작권 침해 및 부정경쟁행위 손해배상 소송을 제기했고 2월에는 한국신문협회가 자사 기사를 AI에 무단 활용한 행위로 네이버를 공정거래위원회에 제소하는 등 행동에 나섰습니다. 다만 네이버 등 주요 AI 기업들은 “저작권자 허락 없는 콘텐츠는 학습에 사용하지 않는다”는 원칙을 발표하면서 신중을 기하고 있어 자율적인 조치로 분쟁을 최소화하려는 움직임을 보이고 있습니다.

AI 기업을 상대로 한 저작권 소송의 주요 원인은 크게 두 가지로 요약됩니다.

  • 첫번째는 저작권 데이터 무단 활용입니다. 콘텐츠 기업들은 AI 모델의 훈련 데이터로 자신들의 저작물이 동의 없이 쓰였다는 점을 가장 큰 문제로 지적합니다. 뉴욕타임스는 수백만 건의 기사 콘텐츠가 무단으로 ChatGPT 훈련에 이용되었다며 오픈AI와 마이크로소프트를 제소하였습니다. 이미지 분야에서도 게티이미지는 자사가 보유한 수백만 장의 사진이 동의없이 복제되어 AI 이미지 생성에 활용되었다고 AI 저작권 침해 소송을 제기하면서 스태빌리티AI와 법정 공방중입니다.
  • 두번째는 기존 창작물의 시장가치 훼손입니다. ChatGPT 같은 모델이 신문 기사를 바탕으로 요약 답변을 제공하면서, 독자들이 원문 기사 대신 AI 요약만 소비하게 되면서 언론사의 트래픽과 광고수익이 감소한다는 지적입니다. 실제 BBC 보도에 따르면 구글이 AI 기반 요약기능을 테스트한 기간 동안 일부 매체 웹사이트의 검색 유입이 6개월 만에 25%~32% 급감한 사례가 있었습니다. 이미지의 경우도 AI가 특정 화가의 화풍을 모방한 그림을 뽑아내면서 원작자의 시장을 잠식하거나, 경우에 따라 AI 출력물에 저작권 필터가 없어 원본에 포함된 워터마크까지 재현되는 문제가 제기됩니다. 음악 분야에서는 AI가 실제 가수의 목소리로 커버곡을 생성해 유통되는 사례가 증가했는데, 이때 아트스트나 작곡가는 어떠한 보상도 받지 못하였습니다.

AI 콘텐츠 저작권 소송 사례

  • 뉴스 미디어 vs AI 기업 : 뉴욕타임스는 2024년 자사 기사를 무단 학습한 혐의로 OpenAI와 MS를 상대로 소송을 제기했으며, 2025년 3월 뉴욕 연방법원은 OpenAI 측의 소송기각 요청을 받아들이지 않아 본안 심리가 진행 중입니다. 워싱턴포스트 등 미국내 언론 매체들도 “책임 있는 AI를 지지한다” 캠페인을 통해 정부에 콘텐츠 보호를 촉구하고 있으며, 월스트리트저널과 뉴스코퍼레이션은 2024년 10월 퍼플랙시티를 저작권 위반으로 제소하는 등 언론사들의 소송이 잇따르고 있습니다.
  • 작가 vs AI 기업 : 2023년 7월 미국의 유명 작가 세라 실버먼을 포함한 여러 저자가 OpenAI와 메타를 상대로 자신들의 책 무단 활용에 대한 집단소송을 제기하여 화제가 되었습니다. 2023년 9월에는 유명 작가 십여 명과 미국 작가협회가 OpenAI를 상대로 별도의 소송을 제기했고 소설가 마이클 셰이본 등은 OpenAI와 메타를 동시 피고로 소송을 내기도 했습니다. 2025년 6월 윌리엄 앨섭 판사는 AI 모델에 책 내용을 훈련시킨 행위 자체는 공정 이용에 해당할 수 있다고 판단하여 엔트로픽의의 손을 들어주었으나, 불법 경로(예: 인터넷 해적서재인 LibGen 등)로 해당 저작물을 입수해 훈련 데이터로 삼은 행위는 “해적행위(piracy)”라며 위법 소지가 있다고 판결했습니다.
  • 예술가·이미지 DB 기업 vs AI 기업 : 2023년 1월, 게티이미지는 스태빌리티 AI 를 미국과 영국에서 동시에 고소하면서 대형 소송을 촉발했습니다. 배경에는 스태블리티가 게티이미지의 사진 1,200만 장 이상을 무단 복제·학습하여 합성 이미지를 만들었고, 일부 생성 이미지에는 게티이미지의 워터마크까지 나타나 소비자 혼동을 유발했다는 내용입니다. 2025년 6월 월트 디즈니 컴퍼니와 NBC유니버설은 로스앤젤레스 연방법원에 미드저니가 미키마우스, 심슨 가족, 마블 캐릭터 등 유명 IP 캐릭터들을 불법 복제하도록 훈련시켰다면서 공동소송을 제기했고 최근에는 워너브라더스까지 이 소송에 합류하여 슈퍼맨, 배트맨 등 자사 캐릭터의 무단     AI 생성 이미지에 대한 손해배상을 청구하였습니다.
  • 음악 산업 vs AI 기업 : 음악계에서는 2023년 10월 유니버설뮤직그룹을 비롯한 미국의 주요 음악출판사들이 테네시주 연방법원에 엔트로픽을 상대로 집단소송을 제기하며 AI와 음악 저작권 분쟁에 불이 붙었습니다. 이들은 AI 모델인 클로드가 비틀즈, 비욘세 등 유명 아티스트의 곡 500여 곡의 가사를 허가 없이 대량 수집해 학습했고, 프롬프트에 따라 해당 가사를 통째로 출력하거나 특정 가사의 일부를 새 창작물에 삽입하는 등 가사 무단 복제·배포를 하고 있다고 주장했습니다.

한편으로는 법정 밖에서의 협상 및 라이선스 계약을 통한 갈등 해결 사례도 늘고 있습니다. OpenAI는 연이어 제기되는 언론사들의 소송에 대응하여, 2023~2024년에 뉴스코퍼레이션, 파이낸셜타임스, 독일 악셀슈프링어, AP통신, 르몽드 등 주요 매체들과 콘텐츠 사용 협약을 맺고 일정 대가를 지급하기로 합의했습니다.

또한 이미지 분야에서는 셔터스톡 등 이미지 라이브러리가 AI 업체와의 데이터 라이선싱 계약을 체결하여, 자사 이미지를 합법적으로 AI 훈련에 제공하는 대신 보상받는 모델을 도입했습니다. 이러한 타협적 해결책들은 향후 업계 표준으로 자리잡아, 불필요한 소송을 줄이는 한편 콘텐츠와 AI의 공존 방식을 모색하는 움직임으로 평가됩니다.

불확실한 법적 경계, 대응 방안은?

현재는 AI와 콘텐츠 기업 간 저작권 충돌의 원칙을 만들어가는 과도기적 시기로 진행 중인 소송중 일부는 합의로, 다른 일부는 판결로 마무리되면서 법적 경계가 보다 명확해질 것으로 보입니다. 그리고 그 과정에서 새로운 규범과 비즈니스 모델을 구축해갈 것으로 기대됩니다.

미국에서는 저작권법 개정이나 새로운 예외 조항 도입 가능성이 거론되며, 정부 차원의 저작권자와 플랫폼 간 협의 또는 집단 라이선싱 제도 신설 등의 방안도 논의될 것으로 예상됩니다. 이미 미국 상원 등에서는 생성형 AI에 대한 청문회와 입법 논의가 시작되었고 미국 저작권청(USCO)은 AI 관련 정책 검토에 착수하여, AI 출력물의 저작권 등록 시 인공지능 사용 여부를 공개하도록 하는 가이드라인 등을 내놓았습니다 .

또한 AI기업과 콘텐츠 기업간의 소송 판결 결과가 쌓이면 AI 훈련 데이터의 공정이용 범위, 생성물의 저작권 침해 판단 기준 등에 대한 초기 판례법리가 형성될 전망입니다. 예를 들어 미 연방법원이 “대규모 웹 크롤링을 통한 AI 훈련은 공익성이 크므로 허용된다”거나 혹은 “대량의 저작물 축적·분석은 저작권자의 복제권을 침해한다”는 식의 판례 기준을 세우게 되면, 유사 소송의 방향이 좌우될 것으로 보입니다. 다만 현재까지는 대부분의 사건이 1심 절차에 있으며, 법적 불확실성이 해소되지 않은 상태입니다.

궁극적으로 AI 산업과 콘텐츠 산업이 지속적으로 공존·발전하기 위한 법적 토대가 마련되는 방향으로 논의가 수렴될 가능성이 높습니다. 현재의 분쟁들은 그 필요한 조정 과정이라고 할 수 있으며, 향후 몇 년간 이어질 법원 판결과 정책 결정이 AI 산업 분야에서 창작과 혁신의 경계를 어떻게 만들어갈지 주목됩니다.

글: 투이컨설팅 디지털 연구소