학습 데이터 저작권 관련 내용 미비
오픈소스 확대로 분쟁 증가 가능성
"데이터 보상 원칙과 기준 확립해야"
샘 올트먼 오픈AI 최고경영자(CEO)가 잇따라 자신의 엑스(X)에 지브리 화풍의 이미지를 공유했다. 샘 올트먼 엑스(X) 캡처 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
'스튜디오 지브리' 화풍이 온라인에 유행하면서 인공지능(AI) 학습 데이터 저작권 논란이 커졌지만, 정부는 AI 기본법 시행령 초안 마련을 저작권 논의 없이 진행하고 있다. AI의 저작권 침해 문제가 국내외에서 계속 제기되고 있는 만큼, 실효성 있는 법제화를 위해선 논의의 물꼬를 터야 한다는 목소리가 높다.
곳곳에서 이미 AI 학습 저작권 분쟁 중
7일 과학기술정보통신부에 따르면 정부는 이달 중 이해관계자들의 의견을 수렴하고 AI 기본법의 시행령 초안을 마련할 예정이다. 그런데 지난해 12월 국회 본회의를 통과한 이 기본법엔 학습 데이터의 저작권 보호를 명시한 조항이 없기 때문에 시행령에도 포함되지 않을 것으로 보인다. 당초 입법 과정에서 저작권 부분 법제화는 문화체육관광부가 별도로 맡기로 했지만, 뚜렷한 진전이 없다. 문체부 관계자는 이날 한국일보와 통화에서 "관계자들 간 이해 충돌을 조정하는 방안을 모색 중"이라는 원론적 답변을 내놓았다.
하지만 AI 기술의 발전 속도와 사회 영향을 감안하면 저작권 이슈를 제외한 법제화는 자칫 선언적 수준에 그칠지 모른다는 우려가 나온다. 유럽연합(EU)에 이은 세계 두 번째 법제화라는 '속도'도 중요하지만 시장에 방향을 제시할 수 있는 실질적 규제를 확립할 필요도 있다는 얘기다. 이성엽 고려대 기술경영대학원 교수는 "AI 기술 전체를 아우르는 법인 만큼 학습 데이터 저작권에 대해 원칙적인 내용이라도 포함될 필요가 있다"며 아쉬워했다.
AI의 학습 데이터를 둘러싼 저작권 분쟁은 이미 국내외에서 다수 발생했다. 뉴스 콘텐츠를 AI 학습에 무단 활용했다며 KBS·MBC·SBS는 올 초 네이버 등을 상대로 저작권 침해중지 소송을 제기했다. 2023년 1월 사라 앤더슨을 비롯한 시각 예술가들은 저작권 이미지를 무단 사용한 혐의로 미드저니 등 생성형 AI 기업을 상대로 소송을 걸었다. 마이클 샤본 등 미국 작가들도 같은 해 오픈AI가 작품들을 무단 복사해 학습 데이터로 이용했다며 집단소송을 냈다.
"콘텐츠 특성 따라 비용과 공개 범위 달라야"
게티이미지뱅크 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
누구나 사용·수정할 수 있는 오픈소스 AI가 확대될수록 저작권 문제는 더 복잡해질 것으로 전망된다. 최경진 가천대 법학과 교수는 "오픈소스로 만든 결과물이 저작권 침해 문제에 맞닥뜨릴 경우 '누가 책임져야 하나'를 둘러싸고 법적 다툼이 생길 수 있다"고 지적했다. 오픈소스를 공개할 때 2차 저작물 권리 범위를 명시한다 해도 다양한 오픈소스를 사용해 만든 결과물의 경우 개발자, 수정자, 이용자 등 여러 사람 간에 서로 다른 권리가 충돌할 가능성이 있다.
광범위하게 학습 데이터 활용을 제한하거나 공개를 의무화하는 건 기술 혁신을 억누른다. 국내 IT 업계 관계자는 "학습된 데이터나 프로세스가 공개되면 핵심 기술과 영업 전략이 노출돼 경쟁력이 약화할 수 있고, 국내와 글로벌 기업의 형평성 문제도 생길 수 있다"고 짚었다. 변형진 이스트소프트 AI최고개발책임자(CAIO)는 "기존 검색엔진과 마찬가지로, 공정이용 기준을 준수한다면 데이터에 자유롭게 접근할 수 있게 하는 방법도 고려할 수 있을 것"이라고 제안했다.
김태연 기자 tykim@hankookilbo.com
세종= 신혜정 기자 arete@hankookilbo.com
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.