딥시크·문샷·미니맥스 등 中 3사
가짜계정 2.4만개로 데이터 도용
대화기록 1600만건 이상 수집 주장
美행정부도 “증류 기법으로 학습”
오픈AI 이미 하원에 정보탈취 경고
<이미지를 클릭하시면 크게 보실 수 있습니다> |
미국 대표 인공지능(AI) 개발사들이 중국 AI 스타트업이 자신들의 학습 정보를 무단으로 도용했다고 폭로했다. 도널드 트럼프 미국 행정부가 국가 안보 위협을 이유로 중국의 AI 패권 야욕을 견제하지만 중국은 수출이 금지된 미국 반도체까지 몰래 사용해가며 미국을 위협한다는 게 업계의 주장이다.
앤스로픽은 23일(현지 시간) 자사 블로그를 통해 딥시크·문샷AI·미니맥스 등 중국 기업 3곳이 자사 AI 모델 ‘클로드’의 기능을 불법적으로 추출해간 사실을 확인했다고 공개했다. 앤스로픽은 챗GPT 개발사인 오픈AI와 함께 전 세계 AI 시장을 선도하는 미국의 초대형 스타트업이다.
로이터통신에 따르면 이날 미 행정부 고위 관료도 “딥시크의 최신 AI 모델은 앤스로픽과 구글·오픈AI·xAI를 포함한 미국 주요 AI 기업들의 모델을 ‘증류(distillation)’하는 방식에 크게 의존했을 것”이라며 “딥시크 측이 미국산 AI 칩 사용을 확인할 수 있는 기술 지표를 삭제해 확인은 어려울 것으로 보고 있다”고 밝혔다.
앤스로픽은 중국 기업 3개사가 가짜 계정 2만 4000개를 만들어 클로드에 접근한 뒤 대화 기록 1600만 건 이상을 빼갔다고 보고 있다. 미니맥스가 1300만 건으로 대부분을 차지했고 문샷AI와 딥시크가 가져간 정보는 각각 340만 건과 15만 건이었다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
증류는 다른 AI 모델이 내놓는 답변을 토대로 유사한 능력을 갖춘 모델을 만드는 방식이다. 증류로 자사 상위 모델의 하위 버전을 만드는 것은 문제되지 않지만 경쟁사 정보를 무단으로 가져가는 것은 불공정 행위다. 앤스로픽 서비스 약관은 증류로 데이터를 몰래 수집하는 것을 금지하고 있다.
앤스로픽은 국가 안보상 이유로 중국 내 클로드 접속을 막았지만 중국 기업들은 이를 우회했다고 설명했다. 또 기존 모델에는 생물학 무기 개발이나 악의적인 사이버 활동에 악용되는 것을 막는 안전장치가 있지만 불법으로 추출된 모델은 이런 안전장치가 제거될 수 있어 안보 위협 우려가 있다고 지적했다.
앤스로픽은 “우리는 미국이 AI 분야에서 선도적 지위를 유지하기 위해 (반도체) 수출통제를 일관되게 지지해왔다”며 “증류 공격으로 중국 공산당의 통제를 받는 연구소들이 경쟁 우위를 점하게 되면서 수출통제 조치가 약화될 수 있다”고 우려했다. 앞서 다리오 아모데이 최고경영자(CEO)는 트럼프 대통령이 엔비디아 AI 칩의 중국 수출을 허용한 방침이 북한에 핵무기를 파는 것과 비슷하다면서 “국가 안보에 엄청난 함의를 가진 실수”라고 비판한 바 있다.
오픈AI 역시 이달 12일 미 하원 중국특별위원회에 제출한 메모를 통해 중국 기업이 미국 AI 모델의 결과물을 무단으로 추출해가고 있다고 경고했다. 중국 대표 AI 개발사인 딥시크가 증류 기법으로 오픈AI 정보를 빼내 자사 챗봇 ‘R1’ 훈련에 쓰고 있다는 것이다. 지난해 1월 공개된 R1은 챗GPT 개발 비용의 10분의 1만 쓰고도 유사한 성능을 구현해 전 세계를 깜짝 놀라게 한 AI 모델이다.
이 같은 주장이 사실이라면 챗GPT와 클로드를 위협하고 있는 R1이 실상은 두 모델을 기반으로 진화하고 있다는 뜻이 된다. 딥시크가 지난해 9월 공개한 논문에서는 자사 모델의 학습 비용이 챗GPT의 300분의 1에 불과하다는 주장까지 제기됐다. 오픈AI와 앤스로픽이 천문학적인 돈을 쏟아부어 AI 모델을 만들면 중국 기업들은 베끼기와 짜깁기를 통해 미국 경쟁사들을 위협할 저비용 고사양 모델을 개발하고 있다는 의미다.
미국은 R1을 비롯한 딥시크 모델들도 자국 AI 서비스 학습 정보를 탈취해 개발한 것으로 의심하고 있다. 딥시크는 지난해 연구 논문에서 ‘V3’ 일반 웹페이지와 전자책만 사용해 사전 학습했다고 해명했지만 미국은 실제로는 오픈AI나 앤스로픽 모델을 짜깁기했다고 반박했다.
실리콘밸리=김창영 특파원 kcy@sedaily.com박윤선 기자 sepys@sedaily.com
[ⓒ 서울경제, 무단 전재 및 재배포 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
