[논문리뷰] 생성형 AI 저작권: 변형적 이용과 감정의 향유

미국: AI 학습 자체는 변형적 이용으로 인정하면서도 불법 데이터 수집(해적 행위)의 공정이용 여부에 대해서는 상반된 결론
일본: '향유를 목적으로 하지 않는 이용' 규정과 의거성 논의가 쟁점

생성형 AI 학습에 대한 공정이용 첫 판결 - 앤쓰로픽 및 메타 케이스의 비교 분석 -, 이대희, 2025

AI 개발을 위해 수많은 저작물을 데이터셋으로 구축하는 과정은 원칙적으로 저작재산권(복제권 등) 침해에 해당할 수 있다. 그러나 방대한 데이터의 저작권자에게 일일이 이용 허락을 받는 것은 현실적으로 불가능하며, 이는 AI 산업의 위축을 초래할 수 있다. 이에 일본은 2018년 저작권법을 개정하여 '저작물에 표현된 사상 또는 감정의 향유를 목적으로 하지 않는 이용' 규정(제30조의4)을 신설하였다.

이 규정이 신설된 배경에는 소송 리스크를 줄이고 명확성을 확보하여 AI 산업 발전을 도모하려는 의도가 있었다. 일본은 저작물 이용 행위를 권리자에게 미치는 불이익 정도에 따라 계층화하였는데, AI 학습을 위한 이용은 권리자의 이익을 해치지 않는 '제1층'의 행위로 분류되었다. 이러한 분류의 기저에는 "저작권은 저작물의 '향유(Enjoyment)'에 대한 대가를 받을 기회를 보장하는 것"이라는 논리가 깔려 있다. 즉, 저작물을 감상하거나 정서적 만족을 얻기 위해 사용하는 것이 아니라면, 저작권자의 본질적인 시장 이익을 해치지 않는다는 것이다. 이를 AI 개발을 위한 학습용 데이터 수집에 적용하면 다음과 같은 논리가 성립된다. 데이터 수집 행위는 저작물을 문화적 소산으로서 감상하거나 그 표현의 미적 가치를 느끼기 위한 것이 아니라, 정보 해석과 패턴 인식을 위한 기계적 과정에 불과하다. 따라서 이는 원래 목적인 '향유'를 하는 것이라 볼 수 없으므로, 저작권자의 동의 없이도 이용이 가능하다는 결론에 도달한다.

이 규정의 해석과 관련하여 영리 목적 여부는 중요하지 않다는 점이 특징이다. 해당 조항은 영리와 비영리를 구분하지 않고 오로지 '향유 목적' 유무만을 따지므로, 영리 기업이 상업적 AI를 개발하기 위해 데이터를 학습시키더라도 그것이 감상 목적이 아니라면 저작권 제한 규정이 적용된다. 다만, 해석상 주의할 점은 향유의 목적과 비향유의 목적이 혼합되어 있는 경우이다. 예를 들어, 기존 학습 완료된 모델에 의도적으로 특정 작가의 화풍을 그대로 출력시키기 위해 추가 학습(Fine-tuning)을 시키는 경우, 이는 향유의 목적이 병존하는 것으로 보아 해당 면책 규정이 적용되지 않고 저작권 침해가 될 수 있다.

한국에의 시사점: 문화산업 발전을 위한 저작권의 재해석

일본의 이러한 논의는 한국 저작권법 체계에도 중요한 시사점을 준다. 한국 저작권법의 목적 역시 저작자의 권리 보호뿐만 아니라 공정한 이용을 도모하여 문화 및 관련 산업의 발전에 이바지하는 데 있다. 저작권은 창작을 유인하는 인센티브로서 기능해야지, 새로운 기술 발전을 가로막는 장벽이 되어서는 안 된다. AI 학습 과정에서의 저작물 이용은 인간의 뇌가 정보를 학습하는 것과 유사하며, 단지 기계적으로 복제·전송될 뿐 실질적인 '향유'가 일어나지 않는다. 따라서 학습 단계에서의 이용만으로는 저작권자의 실질적 이익을 침해한다고 보기 어려우며, 일본과 같이 유연한 권리 제한 규정을 도입하여 AI 산업 발전과 저작권 보호의 균형을 맞출 필요가 있다.

AI 결과물 생성・이용 단계에서의 저작권 침해 문제와 '의거성'의 딜레마

학습 단계를 넘어, 실제로 생성된 AI 결과물이 기존 저작물과 유사할 때 발생하는 침해 문제는 더욱 복잡하다. 저작권 침해(표절)가 인정되기 위해서는 두 가지 요건이 충족되어야 한다. 첫째, 양 작품이 실질적으로 유사해야 한다는 '유사성' 요건이다. 둘째, 결과물이 기존 저작물에 기초하여 만들어졌다는 '의거성' 요건이다. 즉, 우연의 일치가 아니라 타인의 저작물을 보고 베꼈다는 사실이 입증되어야 한다.

일본의 논의에 따르면, 이용자가 기존 저작물을 인식하고 프롬프트에 입력한 경우(예: "○○ 스타일로 그려줘")에는 당연히 의거성이 인정된다. 논란이 되는 지점은 '이용자는 기존 저작물을 몰랐지만, AI 학습 데이터에 해당 저작물이 포함된 경우'이다. 이 경우 일본은 AI 이용자가 직접 저작물을 보지 않았더라도, 학습 데이터에 포함되어 있었다면 객관적인 접근 가능성이 있었던 것으로 보아 의거성을 추정할 수 있다고 판단한다.

여기서 더 나아가 법적 책임의 주체에 대한 논란이 발생한다. 이용자는 의거성(인식) 없이 AI를 사용했음에도 결과적으로 침해자가 될 위험에 처한다. 일본의 논의는 이용자가 AI를 '도구'로 사용한 것이므로, 도구(AI)가 이미 학습한(접근한) 저작물은 사용자도 접한 것으로 간주하는 논리를 취한다. 이는 이용자 입장에서 억울할 수 있는 부분이나, 고의나 과실이 없는 경우 손해배상 책임은 면할 수 있어도 부당이득 반환 등의 책임은 남을 수 있다. 또한, AI 사업자가 침해 가능성을 알면서도 억제 조치를 취하지 않았다면, 사업자 역시 규범적인 침해 주체로서 책임을 질 가능성이 있다는 점도 중요하게 논의되고 있다. 이는 AI 기술이 가져온 전통적 법리와의 충돌을 보여주는 대표적인 사례로, 향후 한국에서도 면밀한 검토가 필요한 지점이다.

[논문리뷰] 생성형 AI 저작권: 변형적 이용과 감정의 향유

관련 기사

광고 속 AI에 대한 세대별 수용 차이

대규모 언어모델 이해 논쟁: AI 윤리, 확률적 앵무새 논문 위험 분석

대규모 언어모델 학습 데이터 기억과 프라이버시 문제: GPT-2 논문 리뷰