컨텐츠 바로가기

    12.13 (토)

    이슈 IT기업 이모저모

    AI 뉴스 저작권 갈등 점화…네이버 “이미 충분히 지급”

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>




    [디지털데일리 오병훈기자] 네이버클라우드와 지상파 3사(KBS·MBC·SBS) 간 인공지능(AI) 저작권 소송이 본격적인 공방 단계에 접어들었다.

    방송 3사는 “네이버클라우드가 약관과 무관하게 AI 학습에 자사 콘텐츠를 활용했다”고 주장하고 있으며 이에 대해 네이버클라우드는 “약관에 명시된 ‘문장추출’ 조항이 이미 AI 학습을 전제한 내용이며 그에 따른 대가도 충분히 지급했다”고 맞섰다.

    서울중앙지방법원 제63민사부는 6일 방송 3사가 네이버클라우드를 상대로 제기한 저작권 침해 중지 등 청구 소송의 2차 변론을 진행했다. 이날 열린 2차 변론기일에서 네이버클라우드 측은 1차 변론 당시 방송 3사 측 주장을 전면 반박하는 취지의 서면을 제출했다. 주요 쟁점을 두고 양측 입장이 평행선을 달리면서 향후 법정 공방이 더욱 치열해질 전망이다.

    ◆“약관상 문장추출 문구 명시…AI학습 위한 전처리를 전제”

    네이버클라우드 측 변호인단은 네이버와 방송 3사가 체결한 뉴스제휴 계약 약관에 따르면 8조 등에서 뉴스 검색 서비스와 구분해 네이버 서비스라는 광범위한 서비스에 이용 가능한 권한을 부여를 하고 있다고 설명했다. 특히 네이버 계열사인 네이버클라우드에서 AI 학습에 기사들이 활용될 수 있는 권한도 포함됐다는 것이다.

    또 2조4항 등에는 ‘문장 추출’이라는 문구가 포함돼 있는데 이것 자체가 이미 AI 학습을 위한 데이터 전처리 과정과 실질적으로 동일한 절차를 염두한 것이라고 주장했다. AI 학습을 위해서는 단순히 문장을 추출하는 ‘웹크롤링’에 이어 원천 데이터를를 AI 학습에 용이하도록 하는 전처리 과정을 거치게 된다.

    특히 생성형 AI는 각 단어마다 의미를 부여하고 가중치를 부여해 학습한 뒤 이를 기반으로 완전히 새로운 문장을 생성한다. 즉 생성형 AI에게 전처리 작업은 식재료(원천데이터)를 먹기 좋은 형태로 조리하는 과정에 비유할 수 있다.

    네이버클라우드 측은 네이버가 이미 수차례 방송사에 관련 대가를 지급했다는 점도 강조했다. 변호인단은 지난 1차변론 기일에서 제기한 ‘약관상 정당한 학습’이라는 주장을 강화하기 위한 근거로 구체적인 약관 세부 내용과 기지급 대가 액수 등을 언급했다.

    재판부는 “준비서면에 따르면 네이버클라우드는 약관 체결 이후 약 5년간 방송3사에 각각 최소 130억원씩 총 수백억원을 지급하기도 했는데 이러한 점도 결국 포괄적인 이용 권한을 부여받은 데 대한 대가로 이해할 수 있다고 주장하고 있다”고 설명했다.

    이에 대해 방송3사 변호인단은 이날 법정에서 “(네이버클라우드 측은) 약관 해석 원칙에 위배되는 해석을 하고 있다”며 “사실관계가 전혀 다른 부분이 있기 때문에 향후 준비 서면과 함께 반박하도록 하겠다”고 맞섰다.

    ◆재판부 “침해된 저작물 구분 명확히 해야”

    약관 문제 외에도 저작권 보호 대상에 대한 쟁점도 화두로 올랐다. 네이버클라우드 측은 저작권법 7조에 따라 사실 전달에 불과한 시사보도의 경우 공공이익 취지에 따라 저작권법 보호 대상에서 제외된다는 점을 강조했다.

    네이버클라우드 측 변호인단은 “원고들이 (네이버클라우드로 하여금) 학습을 금지하고자 하는 기사가 무엇인지 확실히 특정할 필요가 있다”며 “사실 전달에 불과한 시사 보도를 포함해서 청구를 구하는 것인지 다른 기사 등을 포함해 청구하는 것인지 특정이 돼야 방어권을 행사할 수 있다”고 주장했다.

    이에 방송3사 변호인단은 네이버클라우드 측에서 AI 학습 여부에 대해서도 모호한 입장을 취하고 있는 점을 지적하면서 학습 대상 특정을 문제 삼는 것은 논지를 흐리는 주장이라고 반박했다.

    AI 학습에는 기사 개별 보도가 각각 학습되는 것이 아니라 전처리 과정을 통해 데이터 뭉치(데이터셋)를 형성하게 되며 이 과정에서 네이버클라우드가 무단으로 저작권법 보호를 받는 기사 등을 포함시켰다는 설명이다. 즉 개별 기사의 저작물성을 다투고자 하는 네이버클라우드 변호인단 취지는 모순된 주장이라고 지적했다.

    다만 재판부는 방송 3사의 주장에 대해 선을 그었다. 저작권 침해 여부를 판단하려면 개별 저작물을 기준으로 살펴봐야 한다는 취지다.

    재판부는 “네이버클라우드 측이 개별 저작물의 특정이 필요하다고 주장한 것이 사건의 본질을 흐리는 행위로 보이지 않는다”며 “방송 3사가 저작권 침해를 청구 원인으로 제시한 이상, 구체적으로 어떤 저작물이 침해됐는지는 개별 저작물을 토대로 판단할 수밖에 없다”고 밝혔다.

    이에 방송 3사 측 변호인단은 “침해 대상이 된 개별 저작물에 대한 증거를 서면으로 제출하겠다”고 답했다.

    종합하면 이날 2차 변론기일에는 쟁점별 양측 입장 차가 본격적으로 드러났다. 앞선 1차 변론기일 당시 약관 해석 문제를 두고 방송 3사는 ‘약관과 무관한 학습은 무단’이라는 주장을 펼쳤으나 네이버클라우드 측에서는 곧바로 세부적인 약관을 근거로 들며 방어에 나섰다. 이어지는 변론 기일에는 약관에 명시된 권한을 두고 양측의 첨예한 공방이 이어질 것으로 보인다.

    특히 ‘AI 학습 대상의 특정’ 문제는 이번 소송의 핵심 쟁점으로 꼽힌다. 방송 3사의 주장대로 네이버클라우드가 저작권법의 보호를 받는 기사까지 학습에 활용했는지를 판단하기 위해서는 AI 학습 과정 전반을 면밀히 들여다볼 필요가 있다.

    다만 AI 학습 방법론과 과정은 네이버클라우드 측이 핵심 정보를 보유하고 있는 영역으로, 기업 경영기밀에 해당할 수 있다. 이에 따라 해당 부분을 어디까지 공개할 수 있을지가 향후 재판의 주요 관전 포인트가 될 전망이다.

    한편 방송 3사와 네이버클라우드 간 저작권 침해 소송의 3차 변론기일은 내년 1월 22일 오후 2시 10분에 열릴 예정이다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.