<이미지를 클릭하시면 크게 보실 수 있습니다> |
카카오가 지식 기반의 일반 대화와 추론 모드를 모두 지원하는 하이브리드 멀티모달 언어모델을 선보였다.
카카오는 5일 가벼운 일상 대화부터 논리적 사고가 필요한 복잡한 문제 해결까지 하나의 모델로 처리할 수 있는 자체 개발 신규 AI(인공지능) 모델 'Kanana(카나나)-v-4b-hybrid(하이브리드)'의 성능을 공개했다고 밝혔다.
새로운 모델은 지난해 7월 허깅페이스를 통해 오픈소스로 공개한 '카나나-1.5-v-3b'를 토대로 개발됐다. 이미지를 텍스트로 변환하거나 설명하는 수준을 넘어 사람처럼 정보를 종합하고 계산하며 스스로 검산하는 자기 점검 과정을 거친다. 이에 AI 모델의 환각 현상을 최소화하고 계산 실수나 조건 누락을 획기적으로 줄이고 정확도를 한층 높였다는 설명이다.
카나나-v-4b-하이브리드 모델의 고도화를 위해 학습 과정은 단계별로 정교하게 설계됐다. △기초 학습 △장문 사고 사슬(Long CoT) △오프라인 강화학습 △온라인 강화학습으로 이어지는 4단계의 고도화된 학습 절차를 거쳤다.
한국어 논리 전개 능력도 뛰어나다. 기존 글로벌 모델들은 한국어 질문을 영어로 번역해 사고한 뒤 재번역해 답하는 과정에서 맥락과 논리가 결여되는 한계점이 있었지만, 이번 모델은 한국어 질문을 있는 그대로 이해하고 사고한다는 설명이다. 이에 대학수학능력시험 사회탐구나 수학 등의 문제에서 높은 정답률을 기록했다고도 덧붙였다. 한국의 교육 체계를 기반으로 하는 AI 학력 평가 벤치마크인 'KoNET(Korea National Educational Test Benchmark)'에서는 92.8점을 획득했다.
이 밖에도 유사한 크기의 글로벌 모델 큐원3-VL-4B, 인턴VL3.5-4B, GPT-5-나노 및 국내 모델과의 성능 평가에서 과학과 공학, 일반 시각 질의응답, 문서 이해 등의 영역에서 뛰어난 성능을 기록했다. 수학과 과학 등 복잡한 추론이 필요한 영역과 일반 시각 이해 능력에서는 글로벌 모델을 뛰어넘는 성과를 보였다.
카카오는 향후 사용자가 모델을 선택할 필요 없이 AI가 질문의 복잡도를 스스로 판단한 뒤 일반·추론 모드를 직접 자동 전환해 동작할 수 있는 형태로 고도화할 계획이다.
김병학 카카오 카나나 성과리더는 "카나나-v-4b-하이브리드는 한국어 환경에서 가장 자연스럽고 정확하게 생각하고 답변할 수 있는 모델로, 일상과 복잡한 작업을 모두 하나의 AI에 맡길 수 있는 혁신적인 연구 성과"라며 "한국어에 특화된 높은 성능과 효율을 갖춘 자체 AI 모델 개발을 통해 글로벌 경쟁력을 높이고, 국내 AI 생태계 발전의 선도 역할을 이어가겠다"고 말했다.
한편, 카카오는 지난달 고도화된 멀티모달 언어모델 '카나나-o'와 '카나나-v-임베딩'의 연구개발 성과를 공개했으며, 에이전틱 AI 구현에 최적화된 고성능·고효율 언어모델 '카나나-2'를 오픈소스로 공개하는 등 기술 경쟁력을 꾸준히 증명하고 있다.
김소연 기자 nicksy@mt.co.kr
Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
