지금까지의 AI가 방대한 데이터를 학습해 그럴듯한 문장을 만들어내는 확률적 앵무새에 가까웠다면 앞으로 등장하는 AI는 스스로 논리적 단계를 밟아 사고하고 행동하는 추론하는 지성체로 진화하고 있다. 그리고 카카오의 이번 발표는 거대한 기술적 파도 속에서 한국형 AI가 나아가야 할 좌표를 제시하고 있다는 평가다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
생성 너머의 지평, 생각하는 AI 카나나의 등판
지난 3년여간 전 세계를 휩쓴 거대언어모델(LLM) 트렌드는 더 크게, 더 많이 학습시키는 것이었다.이를 위해 막대한 컴퓨팅 파워와 데이터가 필요했다.
지금은 상황이 달라졌다. 막대한 비용 문제와 더불어 그럴듯한 거짓말을 만들어내는 환각 현상, 그리고 복잡한 수학 문제나 논리적 과제 앞에서의 무력함이 드러났기 때문이다.
카카오가 이번에 공개한 카나나-2는 바로 이 지점을 파고들었다.
총 3종의 모델을 공개한 가운데 가장 눈길을 끄는 것은 단연 추론(Thinking) 특화 모델이다. 오픈AI가 최근 선보인 o1(오원) 모델과 같은 계열로 AI가 사용자의 질문에 즉답하기 전에 생각의 사슬(Chain of Thought) 과정을 거치도록 설계된 모델이다. 마치 사람이 어려운 문제를 풀 때 머릿속으로 혹은 연습장에 논리 과정을 적어 내려가듯 AI가 스스로 문제를 분해하고 가설을 세우며 검증하는 단계를 거친다.
AI의 패러다임이 시스템 1(직관적이고 빠른 사고)에서 시스템 2(논리적이고 느린 사고)로 전환되고 있음을 의미한다.
카카오가 이 모델을 내놓으면서 벤치마크 대상으로 삼은 것이 중국 알리바바의 최신 모델인 큐원3(Qwen3)라는 점도 시사하는 바가 크다. 현재 글로벌 오픈소스 생태계에서 가장 강력한 성능을 보여주는 모델과 대등한 성능을, 그것도 훨씬 효율적인 구조로 구현해 냈다는 자신감의 발로이기 때문이다.
무엇보다 주목할 점은 카카오가 이 모델의 설계도에 해당하는 웨이트(가중치)까지 완전한 오픈소스로 공개했다는 사실이다. 폐쇄적인 정책을 고수하는 구글이나 오픈AI와 달리 메타(페이스북)나 미스트랄처럼 생태계를 개방하여 우군을 확보하겠다는 전략이다.
국내 개발자들과 연구자들이 카카오의 모델을 기반으로 다양한 파생 서비스를 만들 수 있는 토양을 제공함으로써 한국어 기반 AI 생태계의 주도권을 쥐겠다는 포석으로 풀이된다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
효율성의 미학, MoE와 MLA가 그리는 온디바이스의 미래
카나나-2의 기술적 성취를 논할 때 빼놓을 수 없는 것이 바로 효율성이다.
사실 아무리 똑똑한 AI라도 천문학적인 구동 비용이 든다면 상용화는 요원하다. 그리고 카카오는 이 딜레마를 해결하기 위해 전문가 혼합(MoE, Mixture of Experts) 아키텍처와 MLA(Multi-head Latent Attention) 기법이라는 두 가지 비기를 꺼내 들었다.
MoE는 쉽게 말해 AI 모델 안에 각 분야의 전문가들을 숨겨두는 방식이다.
기존의 모델이 쉬운 질문이든 어려운 질문이든 뇌 전체를 풀가동해 에너지를 낭비했다면 MoE 구조의 카나나-2는 수학 질문에는 수학 전문가 파라미터만, 문학 질문에는 문학 전문가 파라미터만 깨워서 답을 하게 한다. 이렇게 되면 모델의 전체 크기는 유지하면서도 실제 구동 시에는 훨씬 적은 메모리와 연산 자원만을 사용하게 된다. 효율성이다. 카카오가 강조한 응답 속도 개선과 연산 비용 절감의 핵심 비밀이기도 하다.
여기에 더해진 MLA 기법은 긴 문맥을 처리하는 능력을 극대화한다. AI가 수백 페이지에 달하는 논문을 읽고 요약하거나, 사용자와의 지난 몇 달간의 대화 내용을 기억해야 할 때 필수적인 기술이다.
기존 방식이 입력된 정보가 길어질수록 기하급수적으로 메모리를 잡아먹었던 것과 달리 MLA는 정보를 압축적이고 효율적으로 처리해 적은 자원으로도 긴 호흡의 대화를 가능하게 한다.
이러한 기술적 진보는 온디바이스 AI(On-device AI) 시대와 맥을 함께한다. 클라우드 서버를 거치지 않고 스마트폰이나 노트북 내에서 자체적으로 돌아가는 AI를 구현하기 위해서는 모델의 경량화와 효율화가 필수적이기 때문이다. 이는 카카오톡이라는 국민 메신저를 보유한 카카오가 그리는 큰 그림, 즉 전 국민의 손안에서 작동하는 AI 비서 서비스의 기술적 토대가 완성되었음을 시사한다.
"말만 하던 챗봇은 가라" 행동하는 에이전트의 시대
이번 발표에서 또하나 비중 있게 다뤄져야 할 키워드는 바로 에이전틱 AI(Agentic AI)다.
지금까지의 챗봇이 사용자가 묻는 말에 대답만 하는 수동적인 존재였다면, 에이전트 AI는 사용자의 의도를 파악하고 스스로 도구를 사용하여 문제를 해결하는 능동적인 수행원이다.
카나나-2는 이를 위해 도구 호출(Tool Calling) 능력을 전작 대비 3배 이상 향상시켰다. 예를 들어 사용자가 다음 주 도쿄 여행 일정을 짜줘라고 말하면 기존 AI는 텍스트로 된 일정표만 나열했다. 하지만 에이전트 AI는 스스로 캘린더 앱을 열어 일정을 확인하고, 항공권 예매 사이트에 접속해 표를 검색하며, 날씨 API를 호출해 옷차림을 조언하는 등 실질적인 행동을 수행한다.
AI가 단순한 정보 제공자를 넘어 업무를 처리하는 파트너로 진화하는 데 있어 필수 불가결한 요소다. 카카오가 강조한 복잡한 단계별 요구 사항의 정확한 수행 능력은 기업의 업무 자동화(RPA)나 개인 비서 서비스의 품질을 결정짓는 척도가 된다.
여기에 카카오톡이라는 강력한 플랫폼과의 결합은 에이전트 기능의 파괴력을 배가시킬 수 있다. 당장 채팅창 내에서 AI가 쇼핑, 송금, 예약, 검색 등 카카오의 다양한 서비스와 연동되어 작동한다고 상상해 보라.
카나나-2의 도구 호출 능력은 카카오 생태계 내의 수많은 서비스를 유기적으로 연결하는 접착제이자 사용자의 명령을 실행으로 옮기는 손발이 될 전망이다. 카카오가 지향하는 동료 같은 AI가 단순한 감성적 수사가 아니라, 기능적으로 나의 일을 대신 처리해 주는 실체적인 존재임을 증명한다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
글로벌 AI 패권 전쟁과 한국형 소버린 AI의 과제
카카오의 이번 행보는 글로벌 AI 전쟁의 흐름 속에서 읽어야 한다.
현재 실리콘밸리는 추론과 에이전트를 향해 전력 질주하고 있다. 오픈AI는 o1을 통해 추론 모델의 가능성을 증명했고, 구글은 제미나이를 통해 자사 서비스와의 결합을 시도하고 있으며 앤스로픽은 컴퓨터 유즈(Computer Use) 기능을 통해 AI가 마우스를 조작하게 만들었다. 중국도 미국의 제재 속에서도 큐원과 같은 고성능 오픈소스 모델을 쏟아내며 맹추격하고 있다.
이러한 상황에서 카카오가 글로벌 수준에 근접한 성능의 모델을, 그것도 한국어를 포함한 다국어 지원으로 내놓았다는 것은 한국 AI 주권(Sovereign AI) 차원에서 매우 고무적인 일이다.
AI 모델은 데이터를 먹고 자라며 그 데이터에는 해당 국가의 문화와 가치관, 뉘앙스가 담긴다. 그리고 외산 모델이 아무리 뛰어나다 한들, 한국의 복잡한 법률 용어나 미묘한 존대 문화, 최신 유행어를 완벽하게 이해하고 처리하기에는 한계가 있다. 그 연장선에서 카카오가 카나나-2를 기점으로 그 공백을 민첩하게 파고들었다는 분석이 나온다.
카카오가 여세를 몰아 베트남어, 태국어 등 동남아시아 언어까지 지원 범위를 넓힌 것도 흥미롭다. 한국을 넘어 아시아 시장을 겨냥하겠다는 전략적 의지로 해석된다는 분석이다. 실리콘밸리 빅테크들이 영어권 중심의 패권을 쥐고 있는 사이 아시아 특화 데이터와 언어 처리 능력을 무기로 틈새시장을 공략하겠다는 것이다. 이는 네이버와 더불어 한국 기업이 글로벌 AI 생태계에서 독자적인 영역을 구축할 수 있는 가능성을 보여준다.
물론 과제도 만만치 않다. 당장 기술의 발전 속도가 현기증이 날 정도로 빠르다. 오늘 공개된 최신 기술이 내일이면 구식이 되는 것이 이 바닥의 생리다. 그리고 카카오가 약속한 대로 모델 규모의 확장과 온디바이스 최적화를 지속적으로 추진하지 않는다면, 그리고 이를 실제 킬러 서비스로 연결해 수익 모델을 증명해 내지 못한다면 이번의 성취는 빛이 바랠 수 있다.
오픈소스로 공개된 기술이 실제 개발자 생태계에서 얼마나 널리 채택될지도 관건이다. 허깅페이스에는 이미 수만 개의 모델이 올라와 있다. 개발자들의 선택을 받기 위해서는 단순히 성능이 좋은 것을 넘어, 사용하기 편하고 유지보수가 쉬우며 풍부한 문서화가 뒷받침되어야 한다. 나아가 AI 오픈소스에 대한 회의감도 최근 일부 감지되는 상황에서 입체적인 접근이 필요하다는 분석이 나온다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
추론의 시대, 인류와 AI의 새로운 공존 방정식을 향해
추론형 AI의 보편화는 지식 노동의 지형도를 완전히 바꿀 전망이다. 당장 코딩, 번역, 데이터 분석, 법률 검토 등 논리적 사고가 필요한 영역에서 AI는 인간의 강력한 경쟁자이자 최고의 파트너가 될 전망이다.
이제 인간에게 요구되는 능력은 복잡한 논리를 전개하는 것보다, AI에게 올바른 질문을 던지고 AI가 도출한 추론의 결과가 윤리적으로 타당한지, 혹은 현실에 적합한지를 판단하는 메타 인지 능력이 될 것이다. 그리고 카카오가 쏘아 올린 추론의 화살은 개인의 생산성을 높이고 사회적 난제를 해결할 수 있는 의미있는 가치판단과 AI와 인간의 균형을 무너트리는 시발점의 중간에서 당분간 '방황'할 전망이다.
<저작권자 Copyright ⓒ ER 이코노믹리뷰 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
