2026년 3월 31일 현재, 생성형 인공지능(AI)의 산출물 저작권 인정 기준과 학습 데이터 확보 방식은 각국 규제 기관의 공식 문서와 기업 간의 계약을 통해 재편되었다.
미국 저작권청(USCO)과 한국 규제 당국은 프롬프트 단독 산출물에 대한 저작권 불인정 원칙을 고수하고 있으며, 유럽연합(EU)은 AI법(AI Act)에 따른 범용 모델의 데이터 투명성 의무를 시행 중이다.
글로벌 빅테크 기업들은 데이터 무단 학습과 관련된 소송 리스크를 피하기 위해 언론사 및 플랫폼과 대규모 공식 라이선스 계약을 체결하고 있다.
이번 심층분석에서는 각국 법령, 정부 정책 성명, 법원 판결문, 그리고 기업의 공시 자료를 바탕으로 AI 저작권 및 데이터 시장의 현황을 분석한다.
국내 저작권법 문언적 한계와 문체부의 AI 안내서 지침
대한민국 저작권법 제2조 제1호는 저작물을 ‘인간의 사상 또는 감정을 표현한 창작물’로 정의한다는 점에서, 비인간 주체가 전적으로 생성한 결과물은 문언상 저작물 범위에 포함되지 않는다는 해석이 일반적이다.
문화체육관광부와 한국저작권위원회는 2023년 12월 ‘생성형 AI 저작권 안내서’를 발표하고, 2024년 1월 한국저작권위원회 발간물로 안내서를 공개했다. 이 공식 안내서를 통해 실무 참고용 지침을 제시했다.
안내서는 인간의 창조적 개입 없이 생성형 AI가 자동으로 만들어낸 결과물은 원칙적으로 저작물로 보지 않으며, 저작권 등록도 허용되지 않는다고 명시한다. 또한 등록 신청 시 해당 저작물에 AI가 생성한 콘텐츠가 포함된 경우 이를 신청서에 밝혀야 한다고 안내한다.
인간이 AI 산출물을 기본 소재로 삼아 실질적인 수정과 증감을 가한 경우에 한해 별도의 저작물로 인정받을 수 있다. 이후 AI 활용 저작물의 등록 심사 과정에서 사례별 질의응답과 추가 안내가 축적되고 있으나, ‘인간의 창조적 개입 필수’라는 기본 원칙은 유지되고 있다.
미국 저작권청(USCO) 정책 성명 및 연방지방법원 판결 기록
미국 저작권청(USCO)은 2023년 3월 16일 자 연방관보(Federal Register)에 ‘인공지능 기술을 이용해 생성된 자료를 포함하는 저작물의 등록에 관한 정책 성명’을 게재했다.
이 성명은 ‘전통적인 저작 요소가 기계에 의해 생산된 경우, 해당 부분에는 인간 저작성이 결여되어 등록할 수 없다’는 원칙을 재확인하면서, 신청인은 AI 생성물이 포함된 경우 이를 공개하고 인간의 기여를 명시하도록 요구한다.
스티븐 탈러(Stephen Thaler)는 자신이 개발한 AI ‘다부스(DABUS)’를 단독 저작자로 하여 이미지를 등록 신청했지만, 미국 저작권청은 이를 최종 반려했다.
워싱턴 D.C. 연방지방법원은 2023년 8월 판결에서 저작권청의 반려 결정을 유지하면서, 저작권법상 ‘저작자(author)’ 개념은 인간 저작성을 전제로 한다고 판단했다. 이 판결은 인간의 창작성(Human Authorship)이 저작권 인정의 필수 요건이라는 점을 확인했다.
크리스티나 카슈타노바의 그래픽 노블 ‘새벽의 자리야(Zarya of the Dawn)’에 관해, 저작권청은 2023년 2월 서한을 통해 기존 등록 결정을 수정하면서, 인간이 작성한 텍스트와 텍스트·이미지 배열에 대해서만 저작권을 인정하고, 미드저니(Midjourney)가 생성한 개별 이미지는 저작권 보호 대상이 아니라고 밝혔다.
EU AI법(AI Act) 발효 및 범용 AI 투명성 의무 타임라인
데이터 학습 단계의 저작권 규제는 유럽연합(EU)의 입법을 통해 구체화되었다.
EU AI법(AI Act)은 2024년 7월 12일 EU 관보에 게재되었고, 2024년 8월 2일 발효되었다. EU 공식 타임라인에 따르면, 전면 적용은 2026년 8월 2일이지만, 일부 의무는 단계적으로 먼저 적용된다. 특히 거버넌스 규칙과 범용 AI(GPAI) 제공자 의무는 2025년 8월 2일부터 적용된다.
AI법은 오픈AI(OpenAI), 구글(Google) 등 범용 AI 모델 제공자에게 EU 저작권 규정을 준수할 것을 요구하고, 모델 학습에 사용된 데이터의 주요 출처와 유형에 관한 요약 정보를 공개하도록 의무를 부과한다. 이러한 투명성 의무는 권리자들이 자신의 콘텐츠가 AI 학습에 사용되었는지 확인하고 사용 제한(Opt-out) 의사를 표명할 수 있도록 하려는 취지로 설명된다.
글로벌 빅테크 기업의 데이터 라이선스 공시 및 보도 내역
저작권 규제와 소송 리스크가 가시화되면서, AI 기업들은 글로벌 언론사 및 플랫폼과 공식 데이터 라이선스 계약을 체결하고 있다. 금액은 대부분 비공개지만, 일부 계약은 ‘수억 달러 수준’이라는 언론 보도가 나와 있다.
오픈AI는 2024년 5월 뉴스코프(News Corp)와 다년간의 콘텐츠 라이선스 계약을 체결해, 월스트리트저널(WSJ), 뉴욕포스트, 마켓워치 등 주요 간행물의 과거·현재 기사에 접근할 수 있는 권리를 확보했다.
뉴욕타임스 등 일부 언론은 이 계약 규모가 최대 2억 5,000만 달러에 이를 수 있다고 보도했지만, 공식 금액은 공개되지 않았다. 또한 오픈AI는 2023년 12월 독일·유럽 언론사 그룹 악셀 스프링거(Axel Springer), 2024년 3월 프랑스 르몽드(Le Monde)와 스페인 프리사 미디어(Prisa Media), 4월 영국 파이낸셜타임스(FT)와 연이어 뉴스 콘텐츠 사용 계약을 체결했다고 각각 발표했다. 이들 계약은 기사 콘텐츠를 AI 모델 학습과 응답 생성에 활용할 수 있도록 허용한다는 점에서 공통적이다.
플랫폼 데이터 영역에서도 유상 제공 계약이 공시되었다. 레딧(Reddit)은 2024년 2월 상장 신청서(S-1)에서 특정 파트너에게 데이터 API 접근 권한을 제공하는 계약을 통해 연간 약 6,000만 달러 규모 수익이 발생할 것으로 전망된다고 밝혔다. 이후 언론 보도를 통해 해당 파트너가 구글인 것으로 알려졌다.
스택오버플로우(Stack Overflow)와 셔터스톡(Shutterstock) 역시 오픈AI, 애플(Apple) 등과 데이터 학습용 라이선스 계약을 맺은 것으로 공식 발표에 명시되었다.
데이터 무단 학습 관련 분야별 저작권 침해 소송 기록
공식 계약 범위 밖에서는 텍스트, 이미지, 음원 등 전방위적인 저작권 침해 소송이 진행 중이다. 뉴욕타임스(NYT)는 2023년 12월 미국 뉴욕 남부지방법원(SDNY)에 오픈AI와 마이크로소프트를 상대로 저작권 침해 소송을 제기했다.
소장에서는 NYT 기사 텍스트와 유사한 문장이 모델 출력으로 재현되는 '리거지테이션(Regurgitation·되풀이 출력)'을 핵심 쟁점으로 제시했고, 피고 측은 공정 이용(Fair Use)을 포함한 방어 논리를 전개하고 있다.
이미지 제공업체 게티이미지(Getty Images)는 2023년 영국 고등법원과 미국 델라웨어 연방지방법원에 스태빌리티 AI(Stability AI)를 상대로 소송을 제기하며, 자사 워터마크가 포함된 사진 수백만 장이 라이선스 없이 복제·학습에 사용되었다고 주장했다. 영국 소송은 2025년 하반기 고등법원 판결을 통해 일부 청구가 기각되는 등 개별 쟁점에 대한 법리 판단이 이어지고 있다.
유니버설 뮤직 그룹(UMG) 등 음악 퍼블리셔들은 2023년 10월 미국 테네시주 연방지방법원에 앤스로픽(Anthropic)을 상대로 소송을 제기해, AI 모델이 저작권 있는 노래 가사를 무단 복제·학습하고 이를 출력함으로써 복제권과 배포권을 침해했다고 주장했다. 2025년 3월 판사는 가사 학습 행위 자체를 즉시 중단시키려는 원고 측의 가처분 신청은 기각했지만, 본안 소송은 계속 진행 중이다.
KBR Insight
-
공개된 지침과 등록 사례를 보면, 대한민국 문체부 및 미국 저작권청(USCO)의 '단순 프롬프트 입력 AI 산출물 저작권 불인정' 원칙은 2026년 현재까지 유지되고 있는 것으로 파악된다.
-
워싱턴 D.C. 연방지방법원은 다부스(DABUS) 사건 판결문을 통해 인간의 창작성이 저작권의 필수 요건임을 법적으로 확인했다.
-
2024년 8월 2일 발효된 EU AI법의 공식 타임라인에 따라, 2025년 8월 2일부터 범용 AI 모델 제공자에게 저작권법 준수 및 학습 데이터 요약본 공개 의무가 적용되었다.
-
데이터 학습 영역에서 글로벌 빅테크와 플랫폼 기업 간의 유상 라이선스 계약 체결이 급속히 확산되며 사실상 생태계의 핵심 축으로 부상하고 있다.
-
NYT, 게티이미지, UMG 등이 제기한 저작권 소송은 원본 데이터의 리거지테이션(되풀이 출력) 현상 입증과 공정 이용(Fair Use) 방어 논리의 성립 여부를 핵심 법리 쟁점으로 다투고 있다.
결론 : ‘인간 저작성’ 원칙의 공고화와 유상 라이선스 중심의 데이터 생태계 전환
2026년 3월 31일 기준, 글로벌 규제 기관의 정책 성명과 사법부의 판결 기록을 종합하면 생성형 AI를 둘러싼 권리 관계의 기본 틀은 다음 세 가지 핵심 축을 중심으로 구체화되었다.
첫째, ‘인간 저작성(Human Authorship)’의 필수 요건 확립이다.
산출물 영역에서 미국 저작권청(USCO)과 한국 문화체육관광부의 지침은 AI 단독 생성물에 저작권을 부여하지 않는다는 원칙을 확고히 하고 있다. 특히 2023년 8월 미국 워싱턴 D.C. 연방지방법원의 다부스(DABUS) 판결과 이후 이어진 USCO의 정책 성명은 ‘기계적 생성’과 ‘인간적 표현’을 엄격히 구분한다.
현재 법적 테두리 내에서 저작권 보호를 받기 위해서는 단순 프롬프트 입력을 넘어, 인간이 결과물을 직접 수정(Inpainting 등)하거나 독창적으로 배열한 과정이 객관적인 작업 기록으로 증빙되어야 함을 시사한다.
둘째, 규제 도입을 통한 학습 데이터의 투명성 의무화다.
2024년 8월 발효된 EU AI법(AI Act)이 유예 기간을 거쳐 2025년 8월 초부터 범용 AI(GPAI) 제공자에게 학습 데이터 요약본 공개 의무를 부과한 것은 글로벌 시장의 중대한 변곡점이 되었다. 이는 그간 ‘블랙박스’로 비판받던 AI 학습 과정을 공적 감시 체계 안으로 끌어들였으며, 원저작자가 자신의 권리를 확인하고 행유(Opt-out)할 수 있는 법적 근거를 마련한 조치로 평가된다.
셋째, 소송 리스크 회피를 위한 유상 라이선스 시장의 급속한 확산이다.
뉴욕타임스(NYT), 게티이미지(Getty Images), 유니버설 뮤직 그룹(UMG) 등 각 분야 권리자들이 제기한 저작권 침해 소송은 빅테크 기업들의 데이터 확보 전략을 근본적으로 변화시켰다.
2024년 이후 오픈AI, 구글, 애플 등이 뉴스코프, 레딧, 셔터스톡 등과 체결한 다년 라이선스 계약은 무단 크롤링에 따른 법적·비용적 불확실성을 줄이기 위한 기업의 전략적 선택이다. 이러한 흐름은 데이터 학습 시장이 ‘무상 수집’에서 ‘합법적 유상 거래’로 전환되는 생태계의 핵심 축으로 부상했음을 보여준다.
결론적으로 2026년 현재 생성형 AI 관련 법리는 일부 판례와 제도적 장치를 통해 상당 부분 가시화되었으며, 향후 사법부의 본안 판결들은 ‘공정 이용(Fair Use)’의 구체적인 경계를 획정하는 최종 지표가 될 것으로 파악된다.

![법률 문서와 정책 지침서 위에 놓인 법봉이 AI 저작권과 관련된 법적 원칙과 제도적 장치의 확립을 상징하고 있다. [사진 = 코리아비즈니스리뷰 자료 사진]](https://epzvqcvbpcduaglyoici.supabase.co/storage/v1/object/public/news-images/legacy-cgi/2026/03/31/1774923647_23490.jpg)