컨텐츠 바로가기

    12.06 (토)

    이슈 인공지능 시대가 열린다

    “한국, AI 데이터 학습 위한 법 체계 모호해...기업에 큰 허들”

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    개인정보보호법 ‘정당한 이익’ 조항 있지만
    ‘처리자 이익이 명백히 정보주체보다 우선’ 규정
    AI 스타트업 71% “개인정보보호법, 개발에 제약”
    전문가들 “기준 완화하고 동의 기반 처리도 손 봐야”


    매일경제

    26일 오전 서울 여의도 국회의원회관에서 열린 ‘AI 대전환의 동력, 데이터 활용 입법 개선 과제’ 토론회에서 참석자들이 기념촬영을 하고 있다. 왼쪽부터 이기대 스타트업얼라이언스 센터장, 박민규 더불어민주당 의원, 장철민 더불어민주당 의원, 이해민 조국혁신당 의원, 신재민 트릴리온랩스 대표, 김한규 더불어민주당 의원, 배현진 국민의힘 의원, 방성현 김앤장 법률사무소 변호사, 김민호 성균관대 교수, 정일권 두들린 정보보호최고책임자, 양청삼 개인정보보호위원회 개인정보정책국장, 김형진 국회 입법조사처 입법조사관. [사진 = 정호준 기자]

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    개인정보보호법의 추상적이고 모호한 조항으로 인해 국내 인공지능(AI) 기업들이 데이터 활용에 어려움을 겪고 있다는 지적이 나왔다.

    특히 AI 모델 학습 과정에서 인터넷에 공개된 정보를 수집해 학습하는 경우 기업의 이익이 정보주체 권리보다 명백하게 우선한다는 요건을 기업이 증명해야 해 기업 입장에서는 큰 걸림돌이 되고 있다는 것이다.

    방성현 김앤장 법률사무소 변호사는 26일 오전 서울 여의도 국회의원회관에서 열린 데이터 활용 입법 개선 과제 토론회에서 “명백하게 우선해야 한다는 요건이 사업자 입장에서 가장 큰 문제점”이라며 “사후적으로는 판단할 수 있지만, AI 학습 단계에서 사전에 이를 확답할 수가 없다”고 지적했다.

    기업들은 AI 모델이나 서비스 개발을 위해 온라인에 공개된 데이터를 주로 활용한다. 이 과정에서 자동화 기술을 활용해 텍스트·데이터 마이닝(TDM)을 진행하는데, 이 과정에서 개인정보 등이 포함될 수 있어 쟁점이 돼 왔다.

    일본과 싱가포르 등은 이같은 상황에 대한 면책 조항을 넓게 적용하고 있는 반면, 한국은 동의 기반 데이터 수집과 이같은 법 체계로 인해 상대적으로 엄격한 기준이 적용된다.

    방 변호사는 “유럽연합(EU)의 개인정보보호법(GDPR)보다 엄격한 수준으로, 기업은 이 ‘명백하게’라는 허들을 넘기기가 어렵다”며 “이같은 표현을 수정하고 공개된 개인정보를 처리할 수 있는 근거를 신설할 필요가 있다”고 분석했다. 추상적인 조항은 바로 잡고 정당한 이익의 근거를 구체화해야 한다는 것이다.

    매일경제

    스타트업얼라이언스가 지난 9월 국내 AI 스타트업 101곳을 대상으로 진행한 정책 인식조사 중 일부. 데이터 수집 및 활용과 관련해 AI 스타트업들이 가장 우선적으로 완화해야 하는 영역으로 꼽은 것은 개인정보 수집·이용 동의 제도였다. [출처 = 스타트업얼라이언스]

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    최근 스타트업얼라이언스가 국내 AI 스타트업 101곳으로 진행한 설문조사에서는 71.3%의 스타트업이 “개인정보보호법이 데이터 수집과 활용에 제약을 준다”고 답하기도 했다.

    토론자로 나선 김현경 서울과학기술대 교수 또한 “개인정보 보호 제도는 개인을 식별하기 위해 데이터를 처리하는 과정을 규제하기 위해 만들어진 법”이라며 “그러나 학습 단계는 개인 식별을 위해 데이터를 처리하는 것이 아니다. EU도 최근 민감정보 데이터셋을 일정 부분 허용하는 법안을 내놓는 등 변화하고 있는데, 우리 또한 다시 고민해봐야 하는 지점”이라고 밝혔다.

    또 다른 문제점은 정보주체 동의 기반의 개인정보 처리 제도다. 방 변호사는 “이미 적법하게 수집한 개인정보를 AI 기술 개발 목적으로 활용하려 할 때 별도 동의를 받아야 하는가도 쟁점”이라며 “동의 기반의 처리는 형식적인 동의나 동의의 남용으로 이어지는 등 정보주체 권리를 실질적으로 보장하는 방안이라고 보기 어렵다”고 분석했다.

    이어 “정보 처리 투명성을 강화하면서, 동의 기반 이외에 다른 개인정보 처리 근거에 대한 논의를 진행해야 한다”고 제언했다.

    거대언어모델(LLM)을 개발하는 스타트업 트릴리온랩스의 신재민 대표는 “LLM 개발을 위한 대규모 데이터를 확보해 활용하고 있는데, 웹상에서 수집한 데이터에서 전화번호 등 개인정보를 필터링하는 과정에서 데이터의 절반가량이 손실된다”며 “만약 예외적인 조항이 있다고 하면 사용할 수 있는 데이터 양이 그만큼 늘어날 수 있을 것”이라고 말했다.

    양청삼 개인정보보보호위원회 개인정보정책국장은 “정당한 이익 조항에서 ‘명백하게’라는 표현이 장애 요소가 되고 있다는 지적에 대해 충분히 공감하고 있다”면서 “다만 대규모로 데이터를 활용할 때는 위험성이 다소 적지만, 버티컬 AI에서는 적절한 데이터 전처리가 없을 경우 위험성이 존재한다. 위험도에 맞는 전처리가 수반될 필요가 있다”고 밝혔다.

    현재 국회에는 기업이 적법하게 수집한 개인정보라면 AI 기술 개발을 위해 수집한 목적 외로 처리할 수 있도록 일부 예외 조항을 두는 개인정보보호법 개정안이 발의된 상태다. 이날 전문가들은 해당 안에 대해 “해당 법안이 통과되면 기업들의 AI 전환 추진에 있어 유용하게 작용할 것”이라고 의견을 모았다.

    [ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.