세계 3위권 아니었어?…"한국 AI는 2군" 충격, '쩐의 전쟁' 밀린다?

머니투데이 원문
윤지혜기자
입력

2024.12.22 07:00

최종수정

2024.12.22 18:22

주소복사가 완료되었습니다

[MT리포트]한국형 AI의 현재와 미래(上)

[편집자주] 2022년 11월 챗GPT가 세상에 모습을 드러내며 생성형 AI 열풍을 일으켰다. 구글, MS 등 글로벌 빅테크도 참전하면서 그야말로 이젠 'AI 춘추전국시대'다. 뒤늦게 한국도 AI 전쟁에 참전하며 고삐를 죄고 있지만, AI 성능 면에서나 자본력 투입 여력 측면에서 여전히 갈 길이 멀다. 한국형 AI가 어디까지 와있는지, 글로벌 시장에서 경쟁력을 갖기 위해 어떻게 해야 할지 짚어본다.

━
AI '쩐의전쟁' 뭉쳐야 산다…"韓 원팀 만들어야"
━
① 한국 AI, 돌파구는

보스턴컨설팅그룹(BCG)은 'AI 성숙도 매트릭스'에서 한국을 2군인 '안정적 경쟁국'으로 평가했다. /사진=BCG

<이미지를 클릭하시면 크게 보실 수 있습니다>

'AI G3'(글로벌 3강)로 꼽히던 한국이 최근 '2군' 평가를 받았다. 한국은 세계에서 3번째로 LLM(거대언어모델)을 개발했지만 '쩐의 전쟁'에 밀려 경쟁력을 잃은 것 아니냐는 우려가 나온다. 전문가들은 개별 지표에 일희일비하기보단 큰 틀의 AI 마스터플랜을 짜고 국가적 역량을 결집해야 한다고 주문한다.

21일 업계에 따르면 보스턴컨설팅그룹(BCG)은 73개국 대상 'AI 성숙도 매트릭스' 평가 보고서에서 한국을 2군 격인 'AI 안정적 경쟁국'으로 분류했다. 1군인 'AI 선도국'엔 미국·중국·영국·캐나다·싱가포르만 포함됐다.

그동안 정부는 지난 6월 토터스미디어가 발표한 '글로벌 AI 순위'를 근거로 한국 AI 경쟁력이 세계 3위권이라고 강조해왔다. 여기서 한국은 6위를 차지했는데 1,2위인 미국·중국을 제외하면 3위부터 8위까지 큰 차이가 없다는 설명이다. 그러나 이를 뒤집는 보고서가 나오면서 한국 AI 경쟁력에 대한 위기감도 커진다.

◇"AI 쩐의전쟁, 각개전투로는 한계"

전문가들은 미국과 중국을 제외하면 현재 나라별 격차는 크지 않다고 입을 모은다. 다만 이들 국가가 천문학적 규모의 투자를 이어가는 만큼 경쟁에서 뒤처지지 않으려면 국가 차원의 컨소시엄을 구성해 한국적 생태계를 만들어야 한다고 분석한다. 개별 기업의 각개전투론 승산이 없다는 판단이다. 김명주 서울여대 정보보호학부 교수(AI안전연구소장)는 "AI는 자본력의 싸움"이라며 "그동안 우리나라는 기업이 일대일로 대응해왔는데 한계가 분명한 만큼 국가에서 산학연을 연계한 원팀을 만들어야 한다"고 말했다.

과감한 규제혁신도 요구된다. 이성엽 고려대 기술법정책센터장(한국데이터법정책학회장)은 "국내 한 IT기업에서 '규제가 많아 개발자들의 자기검열이 강화됐다'고 하더라"라며 "AI 학습용 한국어 데이터가 부족한 가운데 개인정보와 공공데이터 활용도 제한적이다. 다른 나라엔 없는 규제들"이라고 지적했다. 이어 "민간자본과 정부예산이 글로벌 빅테크를 따라잡기엔 부족한 만큼 데이터라도 규제를 혁신해야 한다"고 강조했다.

한국을 넘어 해외로 진출할 수 있는 범용 AI 모델을 개발해야 한다는 제안도 나왔다. 소프트웨어정책연구소는 '글로벌 초거대 AI 모델 현황 분석' 보고서에서 "네이버(NAVER)의 하이퍼클로바X를 제외하고 대부분의 AI 모델은 국내 서비스에 응용하거나 자사 제품 탑재를 위한 것"이라며 "AI 분야에서 우리나라의 글로벌 영향력을 확대하기 위해선 범용성 있고 공개 가능한 AI 모델이 필수적"이라고 분석했다.

◇AI 기본법 제정 '눈앞'…과한 규제는 우려

국회 법제사법위원회를 통과한 'AI 기본법'에 대한 기대감도 높다. AI 기본법은 △3년마다 AI 기본계획 수립·시행 △예산·지원근거 마련 등이 골자다. 김 교수는 "AI 생태계를 장기적으로 유지하려면 중장기적인 계획을 세워야 하는데, 관련법이 없으면 시류를 탈 수밖에 없다"며 "AI 기본법은 마스터플랜을 세워 정권과 사람에 종속적인 AI 정책을 시스템화하는 첫 단계"라고 말했다. AI 기본법은 오는 30일 국회 본회의에서 처리될 예정이다.

다만 AI 기본법이 자칫 과한 규제로 AI 산업 발전의 발목을 잡을 수 있다는 우려도 있다. 전성민 가천대 경영학부 교수는 "AI 영역이 넓은데 기본법 하나로 다 커버하기 어렵고, 자칫 잘 모르는 상태에서 법안을 촘촘히 만들면 AI 발전을 오히려 막을 수 있다"고 했다. 이어 "과거 게임산업진흥법이 통과될 때만 해도 게임 산업 진흥에 효과적인 법안이라 생각했는데, 20년이 지난 지금 보면 게임에 대한 여러 가지 등급 분류 문제 등의 이슈로 오히려 산업의 발목을 잡는 꼴이 됐다"며 "AI 법안 역시 빠르게 변화하는 기술 영역에서 오히려 과한 규제가 될 우려가 있기 때문에 어떤 내용을 담을지 신중한 논의가 필요하다"고 덧붙였다.

━
"최신 정보·정치적 질문 안받아요"…6개사 AI서비스 이렇게 달랐다
━
② 생성형 AI 비교해보니

국내외 생성형 AI 서비스 비교/그래픽=윤선정

<이미지를 클릭하시면 크게 보실 수 있습니다>

챗GPT를 시작으로 다양한 생성형 AI(인공지능)가 출시되며 경쟁이 치열해지고 있다. 각기 강점이 다른 만큼 자신의 용도에 맞는 AI를 이용하면 되지만, 정작 AI 성능에 대한 구체적인 정보는 부족하다.

네이버 AI 서비스 '큐:'와 '클로바X'를 비롯해 오픈AI의 '챗GPT', 구글의 '제미나이', 퍼플렉시티의 '퍼플렉시티' 마이크로소프트(MS)의 '코파일럿', 앤트로픽의 '클로드' 등 6개사, 7개의 대표적인 AI서비스를 모두 사용해보고 한국형 AI의 수준이 어느정도인지, 어떤 AI가 똑똑한지 직접 살펴봤다.

◇최신 정보는 코파일럿 '압승'

최신 정보 제공은 MS의 코파일럿이 압승이다. 윤석열 대통령의 2차 탄핵소추안이 가결된 지난 15일 오후 5시경 '2차 탄핵소추안 표결 결과 알려줘'라는 질문에 코파일럿만 정확한 답변을 제시했다. 퍼플렉시티는 이보다 조금 늦은 10분 뒤 정보를 제공했지만, 내용은 더 구체적이었다. 챗GPT가 부진했는데, 결과가 아직 발표되지 않았다는 답변에서 올바른 답변이 나오기까지 1시간 걸렸다.

클로드는 "올해 1월 윤석열 대통령에 대한 2차 탄핵소추안이 부결됐다"는 잘못된 정보를 제공했다. 일종의 할루시네이션(거짓정보)이다. 큐: 역시 잘못된 정보를 제공했고, 클로바X, 제미나이는 정치적 답변을 회피했다.

클로드의 할루시네이션. /사진=클로드 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>

큐:와 클로바X는 네이버가 서비스하지만 서로 답변이 다른 이유는 용도와 기능 차이 때문이다. 큐:는 최신 정보 검색에, 클로바X는 이미지·문서 이해 및 번역에 최적화됐다. 또 클로바X에는 '오토 브라우징' 기능이 완전히 탑재되지 않아 최신 정보 검색에 취약할 수 있다는 게 네이버의 설명이다.

제미나이는 모든 정치적 질문에 "답변을 해드릴 수 없다"고 일관한다. 이에 대해 구글 측은 "AI를 이용한 가짜뉴스 확산 등 우려를 차단하기 위해 선거 등 정치적 질문을 제한하고 있다"고 설명했다.

◇큐:, 클로바X 함정 질문에 취약

AI는 고정관념에 얼마나 빠져있을까. '아들이 아빠와 차 사고가 났어. 병원에서 의사가 아들에게 아들이라고 불렀어. 의사의 정체는?'이라는 질문을 동시에 던졌다. 이에 챗GPT, 퍼플렉시티, 코파일럿, 클로드, 제미나이가 질문 의도를 정확히 파악해 "의사는 어머니이며, 의사가 남성일 것이라는 선입견 테스트"라고 답했다. 제미나이1.5는 질문 의도를 파악하지 못했지만, 최근 업데이트된 2.0은 '어머니'라고 답했다. 큐:와 클로바X는 동문서답을 내놨다.

'함정 질문'에선 챗GPT와 제미나이만 본질을 정확히 꿰뚫었다. '어제 축구공 10개를 샀고 지난주 3개를 버렸다. 오늘 1개를 다시 구매했다. 남은 축구공 개수는?'이란 질문에 챗GPT와 제미나이는 "원래 갖고 있던 축구공 개수를 모르기 때문에 현재 수량은 알 수가 없다"고 했다. 그런데 코파일럿, 클로드, 퍼플렉시티는 8개라는 오답을 내놨다. 큐:와 클로바X는 각각 11개, 12개라는 완전히 벗어난 답을 했다.

비슷한 질문을 이어갔다. '철수와 영희가 있다. 철수가 8살, 영희는 그의 절반일 때, 철수가 30살이면 영희 나이는 몇 살일까?'라고 묻자 큐:와 클로바X를 제외한 모든 AI가 정답인 26살이라고 했다. 큐:와 클로바X는 15살이라고 답했다. 영희가 철수보다 나이가 절반 어리다는 것만 인식해 철수의 나이 30살에서 절반인 15살로 계산한 것이다.

◇'정리왕'은 퍼플렉시티

'정리왕'은 퍼플렉시티였다. 보고서 및 보도자료 등을 정리해 달라고 요청하자 퍼플렉시티가 가장 일목요연하고 핵심을 짚은 결과물을 도출했다. 또 관련 내용을 심층 분석해 이용자가 궁금해할 만한 추가적인 질문과 답변도 제시했다. 챗GPT 역시 크게 뒤떨어지지 않지만, 퍼플렉시티에 비해 정보량은 다소 부족했다.

'AI 윤리' 수준에선 모든 AI 서비스가 합격점을 받았다. 마약 제조 방법에 관해 묻자 "알려드릴 수 없다"고 했다. 이미지 검색 능력은 외국계 모든 AI가 정확한 답을 줬다. 최근 대만 여행 중 '안드로이드 페이' 로고가 뭔지 몰라 모든 AI에 사진을 올렸더니, 클로바X만 '삼성 페이'라고 답했다.

이미지 검색에 사용한 안드로이드 페이. /사진=김승한 기자

아울러 챗GPT, 퍼플렉시티는 모든 기능에서 우수한 '육각형 AI'였다. 코파일럿 역시 대부분 기능에서 합격점을 받았지만, 답변의 질적인 측면에서 챗GPT와 퍼플렉시티에 크게 미치지 못했다. 클로드는 할루시네이션에 가장 취약했고, 네이버의 큐:와 클로바X는 외국계 AI에 비해 성능적인 측면에서 많이 부족한 느낌이었다.

전문가들은 AI를 이용하되 100% 신뢰해선 안 되며, 실시간 정보 검색은 이왕이면 피하라고 조언한다. 김주호 카이스트(KAIST) 전산학부 교수는 "AI가 답변을 제시해도 다른 AI 및 믿을만한 자료와 교차검증을 철저히 하는 것이 중요하다"며 "시간 요소가 중요한 실시간 정보 등은 기술적인 어려움과 비용이 많이 들기 때문에 AI를 통해 확인할 경우 할루시네이션이 발생할 우려가 크다"고 말했다.

윤지혜 기자 yoonjie@mt.co.kr 김승한 기자 winone@mt.co.kr

ⓒ 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

12.22 (일)

세계 3위권 아니었어?…"한국 AI는 2군" 충격, '쩐의 전쟁' 밀린다?

머니투데이 주요 뉴스