본문 바로가기 주메뉴 바로가기 푸터 바로가기

관련 기사

저작권과 데이터 윤리 [김윤명박사의 AI 웨이브]
  • 윤리정책법무팀
  • 2025-04-08
  • 46
  • 기사제목
    저작권과 데이터 윤리 [김윤명박사의 AI 웨이브]
  • 언론사
    서울경제
  • 기자성명
    김윤명 디지털정책연구소장(법학박사)
  • 분야,키워드
  • 링크주소

저작권법은 창작자의 권리를 보호하는 동시에 공정한 이용을 보장함으로써, 사회적 이익과 문화·산업 발전의 균형을 도모한다. 그러나 AI 기술의 발전으로 대량의 데이터 활용이 필수적이 되면서, 저작권법과 데이터 윤리 사이의 충돌이 심화하고 있다.

기계학습을 위한 데이터의 확보를 위해 텍스트·데이터 마이닝(TDM)을 입법화하거나 또는 실제 소송에 적용되고 있다. AI 모델 구축 과정에서 방대한 데이터를 이용하면서 저작권법이 어떻게 적용될 것인가에 대한 논쟁이 지속되고 있다. 학습 데이터에 적용될 수 있는 범위에 대한 명확한 기준이 요구된다. 데이터 윤리는 AI 모델의 학습과 결과물의 공정성을 보장하는 중요한 요소로 작용하지만, 윤리적 고려가 법적 규제와 어떻게 조화를 이루어야 하는지는 여전히 불확실하다. TDM 규정을 두고 있는 나라는 공정이용 규정을 두고 있지 않기 때문에 입법화하고 있는 것도 사실이다. 지난해 독일 지방법원에서는 저작권법에 근거하여 학습데이터의 TDM에 대한 무죄판단을 내리기도 했다.

인공지능 학습을 위한 데이터 수집 과정에서 저작권법과 데이터 윤리는 밀접하게 연결된다. 빅데이터 처리와 인공지능 학습 과정에서는 데이터의 복제, 분석 등이 필수적으로 발생하며, 이를 무분별하게 활용할 경우 저작권법 위반 행위가 될 가능성도 있다. 우리 저작권법은 TDM 규정을 두고 있지 않고, 공정이용 규정만 두고 있다.

특히, TDM의 특성상 불특정하게 수집된 데이터 안에 저작물이나 개인정보가 포함될 수 있어 관련 법과 충돌할 가능성이 높다. 이는 단순한 법적 문제를 넘어 데이터 수집의 윤리성, 프라이버시 보호, 그리고 창작자의 권리 존중과 같은 윤리적 문제와도 연결된다. 데이터 수집에서 접근에 제한된 표지(robots.txt)의 강제성이 없는 경우, 이에 대한 접근여부는 저작권법이 아닌 윤리적인 고려를 통해서 판단하여야 할 사항이기도 하다. 나아가 이러한 행위유형을 공정이용으로 볼 수 있는지 여부이다. 공정이용은 법적인 근거를 갖지만, 일반조항이 갖는 성격상 명확한 기준을 제시하는 것은 아니다. 대략적인 방향을 제시하지만, 법원은 이를 바탕으로 최종적인 결론을 내릴 수 있다는 점에서 해석론의 확장이지, 권리창설로 보기는 어렵다. 이에 대해 법원이 권리를 창설하는 것으로 오해할 수도 있을 것이다.

AI 윤리나 데이터 윤리가 저작권법에 지나치게 개입할 필요는 없겠지만, 윤리적 고민이 법의 해석과 향후 인간이 아닌 저작자의 등장에 영향을 미칠 가능성은 높다. 다만, 지나친 윤리의 법화(法化)는 지양되어야 한다. 기술 변화에 적응하기 위해서는 법의 규제적 속성보다는 윤리적 논의가 합리적이다. 다만, 그 논의 방향은 윤리를 배제하는 것이 아니라 법과 함께 균형 있게 고려해야 한다. 데이터 윤리와 저작권법은 모두 기술혁신과 개인의 권리 보호 사이의 균형을 추구한다. 생성형 AI의 학습을 위한 데이터셋이 인터넷에 공개된 정보를 크롤링해 제작되는 과정에서, 이용 허락 조건에 맞지 않게 이용할 경우 저작권 침해나 데이터 윤리로부터 자유로울 수 없다. 그렇기 때문에 AI 기술 발전이라는 사회적 가치와 창작자의 권리 보호라는 가치 사이의 윤리적 균형점을 찾아야 한다.