티스토리 뷰

반응형

AI 저작권 가이드

AI를 통해 만든 결과물의 저작권을 주장할 수 있을까?

일단 현행법상 저작물은 사람이 창작한 것만을 의미하기에 사람만이 저작권자가 된다. 

사람들은 생성형 AI를 이용하면서 여러 번에 걸쳐 명령인 프롬프트를 수정·보완해 재입력하는 과정을 반복하면서 보다 정교하고 완성도 높은 결과물을 얻는다. 이 경우 여러 질문이 파생하게 된다

  • '여러 번에 걸쳐 프롬프트를 수정하며 재입력'한 것을 인간의 창작 행위로 볼 수 있을까?
  • 생성된 결과물은 저작권법상 저작물에 해당할까?
  • 저작물에 해당한다면 누가 저작자/저작권자가 될까?
  • 저작물이 아니라면 누구나 무상으로 자유로이 이용할 수 있는 것일까?

 

2022년 미국 콜로라도주의 한 미술대회 디지털아트부문 우승작 <스페이스 오페라 극장>은 AI로 만든 것이기에 사람들이 크게 반발하고 논란이 일어났음에도 대회 측은 우승을 철회하지 않았다. 작가는 '미드저니를 사용한 제이슨 앨런'이라고 명시한다고 한다. 어차피 대회 출품작이니 저작권은 대회 주관사로 귀속되겠지만 만일 그냥 발표한 작품이라면 저작권을 인정받을 수 있을까?

출처: 트위터, AI도구 미드저니를 이용해 단 한번의 붓터치없이 80시간의 프롬프트 명령만으로 완성하여 수상한 <스페이스 오페라 극장>

 

미국 저작권청은 저작권 관련하여 AI를 이용해 저작물을 만든 경우에는 AI와 사람의 기여 수준과 기여 내용 등을 기재하도록 한다. 즉 AI 저작물은 저작권 등록 대상이 될 수 없다는 것을 시사한다. 우리나라의 경우 아직 정확한 지침이 없지만 AI는 사람이 아니기에 저작권자가 될 수 없음은 확실하다.

결론: 내가 AI를 이용해 만든 결과물에는 나의 저작권을 주장할 수 없다.

 

 

 

AI에게 내 데이터 뺏기지 않고, 개인정보 보호하는 법

AI가 가져다 쓴 내 데이터는 괜찮은가?

생성형 AI가 학습에 사용한 데이터는 허가를 받지 않은 인터넷 속 불특정 다수의 콘텐츠이며, 이를 기반으로 생성하는 모든 콘텐츠는 누군가의 창작물을 잠재적으로 복제했다고 볼 수 있다. 인용 출처의 파악도 불가능한 경우가 대부분이다.

예를 들어 챗GPT에 독도 소유권을 물으면 한글과 영어에 따라 답변이 다르게 나온다. 일본이 뿌린 데이터가 그만큼 많이 광범위하게 퍼져 있다는 것이고 언어에 따라 수집 데이터에 다르고 당연히 답변도 달라진다. 이처럼 애매한 답변의 경우 되풀이 출처와 근거를 물어도 결국 AI는 책임을 지지 않는 답볍으로 종결한다.

출처: NOW 뉴스, 좌-독도, 우-ChatGPT첫화면 캡처

 

오픈 AI사는 GPT를 학습시키기 위해 온라인상의 데이터를 크롤링 (crawling: 온라인 상의 데이터를 자동으로 수집하는 것)방식으로 수집한다는데 여기에는 저작권이 포함된 데이터와 개인정보, 금융 데이터 등이 포함될 수 있다. 그리고 정확히 어떻게 수집하는지 그 기술은 공개하지 않고 있다.

따라서 이미 잘 알고 있지만 챗GPT 등 생성형 AI 도구를 이용할 때는 내가 제공한 데이터, 나의 글, 각종 자료 역시  공공의 데이터로 넘어간다는 점을 숙지하고 이용해야 한다. 

 

AI 학습에 저작권 보호를 받는 데이터를 이용할 수 있는 법적 근거로 '공정한 이용'이라는 개념이 있다. 우리나라 저작권법 제 35조 '공정한 이용'에도 저작물의 통상적인 이용 방법과 충돌하지 않고 저작자의 정당한 이익을 부당하게 해치지 않는 경우 저작물 이용을 허용하고 있다. 그러나 판단 기준이 너무나 모호한데다 사전에 방어할 수 있는 방법은 현재 없는 상태다. 저작권을 침해받은 측이 사후에 피해 사실을 증명해야 하는 구조이기에 저작권자의 데이터 보호는 더욱 힘겨울 수밖에 없다. 

이미 마이크로소프트, 깃허브, 오픈 AI는 오픈소스 코드 데이터 저작권 위반 등으로 소송을, 스테이블디퓨전, 미드저니, 데비안아트는 예술가로부터 공정한 이용에 해당하지 않는다며 소송을 당했다. 

스택오버플로, 레딧, 트위터 등은 대기업이 AI학습에 자사 데이터를 사용하는 것에 대해 비용을 내야 한다며 이용 방침을 새로 수정할 것을 검토하고 있다. 

AI 학습 데이터로 개인 정보를 사용한 뒤 그것이 AI 생성 결과로 나오는 것도 끔찍한 일이다. 최근 오픈 AI는 미국에서 개인 정보 문제로 집단 소송을 당했다. 데이터에 개인식별이 가능한 정보가 포함되어 프라이버시가 침해되었고, 어떠한 배상도 없다는 이유였다. 

우리나라의 개인정보보호법에는 공개된 개인정보를 공개한 목적 범위 내에서만 이용하고 그 외에는 동의를 받아야 한다고 규정했다. 방송통신위원회의 <빅데이터 개인정보보호 가이드라인>에서는 좀 더 허용을 완화해 공개된 개인정보를 비식별화 조치할 경우 이용자 동의 없이도 이용할 수 있게 했다. 

결론: 저작권 자료와 개인 정보를 온라인에 올려두거나 특정 사이트에 제공한 것 모두 AI 저작권 침해와 AI 개인정보 침해에서 안전하지 않다. 기밀정보는 올리지 않아야 하고, 마크 표기·출처 명기 요구·상업적 용도 제한·허락없이 사용시 후과 명기 등 스스로 방어 기제를 마련해야 한다. 또한 별도로 저작권자나 개인정보 제공자는 AI에 부당하게 이용되는 경우를 주시하고 찾아내어 소송, 문제 제기 등 적극적 행동으로 스스로의 권리를 찾을 수밖에 없다.

 

반응형
최근에 올라온 글