차태원 한국저작권위원회 저작권정보센터장 |
지난 12월 26일, 인공지능(AI) 산업 육성을 지원하고 사업자 의무 등을 규정한 '인공지능 발전과 신뢰 기반 조성 등에 관한 기본법'(이하 AI기본법)이 국회 본회의를 통과했다. AI기본법은 AI 산업의 규제와 진흥을 포괄적으로 다루는 내용을 담고 있다. AI는 의료, 교육, 제조, 금융 등 거의 모든 산업 분야에 걸쳐 지대한 영향을 끼칠 수 있는 기술로 평가받고 있어, 이번 법안은 관련 산업의 발전에 크게 기여할 것으로 기대된다. 그러나 동시에, 무분별한 데이터 학습으로 창작자의 저작권을 침해할 우려 또한 제기되고 있다.
대표적인 사례로, 게티이미지(Getty Images)는 저작권으로 보호된 자사 이미지를 AI 모델 학습에 무단으로 사용했다는 이유로 스태블리티 AI(Stability AI)와 오픈AI 등 여러 AI 기업을 상대로 소송을 제기했다. 실제로 AI가 생성한 일부 이미지에서 게티이미지의 워터마크가 포함된 사례가 발견돼, 저작권자의 허락 없이 저작물을 복제 및 활용한 것으로 보이는 정황이 나타났다. 이러한 분쟁은 창작자의 권리를 보호하면서도 AI 기술 발전을 촉진하기 위해 데이터 활용의 투명성을 높여야 한다는 요구로 이어지고 있으며, 우리나라의 AI기본법 제정 과정에서도 “생성형 AI 개발 및 활용에 사용된 학습 데이터 목록을 공개해야 한다”는 요구의 목소리가 음악 등 각 분야에서 제기되고 있다. 국내 언론사들도 AI 학습데이터와 관련하여 중요한 요구사항을 제시하고 있는데, 한국신문협회 등 5개 언론단체는 AI 사업자의 학습데이터 공개 의무화, 저작권자의 열람권 보장, 투명성 확보, 저작권 보호 및 정당한 대가 요구 등을 촉구하는 의견서를 제출한 바 있다. 이에 따라 향후 AI기본법 개정 등을 통해 학습데이터의 투명성을 높이기 위한 보완이 필요하다고 생각된다.
한편, AI 학습데이터로써의 활용 측면에서 공유저작물의 중요성이 더욱 부각되고 있다. 공유저작물이란 사회구성원 누구나 자유롭게 이용할 수 있는 저작물로서 크게 저작권이 만료된 저작물과, 기증저작물, 자유이용허락저작물(CCL) 및 공공기관 무료개방 저작물을 의미하는 것으로 한국저작권위원회는 2012년부터 2024년 12월 현재까지 '공유마당' 서비스를 통해 권리 처리가 완료된 264만여건의 각종 저작물을 일정조건 하에 자유롭게 활용할 수 있도록 다양한 콘텐츠를 제공하고 있다.
공유저작물을 AI 학습 원천 데이터로 활용하는 것은 여러 가지 장점을 제공한다. 첫째, 권리 침해에 대한 법적 리스크를 최소화할 수 있다. 저작권 침해로 인한 분쟁 가능성을 줄이고, 창작자의 권리를 존중하면서도 AI 개발에 필요한 데이터를 확보할 수 있다. 둘째, 데이터 구매나 직접 생성에 드는 비용을 절감할 수 있다. 이는 특히 연구자, 중소기업, 스타트업 등 자원이 제한된 주체들에게는 AI 개발의 진입 장벽을 낮추는 중요한 역할을 한다.
공유저작물의 활용은 AI 산업의 공정성과 창의성을 촉진하는 데에도 중요한 의미를 가진다. 대규모 자본을 보유한 대기업은 이미 방대한 데이터를 구축할 수 있는 능력을 갖추고 있지만, 소규모 기업이나 연구자들은 이에 비해 상대적으로 불리한 위치에 있다. 공유저작물은 이러한 데이터 접근성의 격차를 줄이고, 혁신적인 연구와 창의적인 서비스 개발을 가능하게 할 것이다.
이렇게 공유저작물은 AI시대의 데이터 활용에 대한 윤리적 대안을 제시하는 동시에, 창작자와 개발자 간의 조화를 이루는 데 핵심적인 역할을 할 수 있을 것으로 기대된다. 앞으로도 더욱 다양한 공유저작물이 확보돼 공정한 저작물의 이용 활성화와 더불어 AI산업과 기술 발전에도 보탬이 되기를 희망해 본다.
차태원 한국저작권위원회 저작권정보센터장 twcha@copyright.or.kr
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.