<이미지를 클릭하시면 크게 보실 수 있습니다> |
네이버클라우드는 과학기술정보통신부 '독자 AI 파운데이션 모델' 프로젝트의 주관 사업자로서 추진 중인 '옴니 파운데이션 모델' 개발 과제의 첫 번째 성과를 29일 공개했다. 네이버클라우드는 국내 최초로 네이티브 옴니모달(하나의 모델이 텍스트·이미지·오디오와 같은 다양한 모달리티를 동시에 이해하고 생성할 수 있는 형태) 구조를 적용한 파운데이션 모델인 '네이티브 옴니모델(하이퍼클로버X씨드 8B 옴니)'과 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 '고성능 추론모델(하이퍼클로버X씨드 32B 씽크)'를 각각 오픈소스로 공개했다.
네이버클라우드는 옴니모달 AI의 잠재력을 극대화하기 위해 현실 세계의 다양한 맥락을 담은 데이터 확보에 집중한다는 전략이다. 네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 "모델을 대규모로 키워도 데이터 다양성이 한정되어 있다면 AI의 문제 해결 능력도 특정 영역 또는 특정 과목에만 집중되어 나타날 수밖에 없다"며 "디지털화되지 않은 생활 맥락 데이터나 지역의 지리적 특성이 반영된 공간 데이터 등 차별화된 현실 세계 데이터를 확보하고 정제하는 과정이 선행돼야 한다"고 설명했다.
텍스트·이미지·음성 모델을 결합하는 방식의 기존 멀티모달 접근과 달리, 단일 모델 구조의 옴니모달 AI는 규모 확장이 상대적으로 용이하다는 점도 특징이다. 또한 하이퍼클로버X씨드 8B 옴니는 텍스트 지시를 기반으로 이미지를 생성·편집하는 옴니모달 생성 기능도 갖췄다. 텍스트와 이미지의 맥락을 이해해 의미를 반영한 결과물을 생성해내는 방식이다.
'하이퍼클로버X씨드 32B 씽크'는 자체 추론형 AI에 시각 이해·음성 대화·도구 활용 능력을 결합해, 복합적인 입력과 요청을 이해하고 문제를 해결하는 옴니모달 에이전트 경험을 구현했다. 해당 모델로 올해 대학수학능력시험 문제를 풀이한 결과 국어·수학·영어·한국사 등 주요 과목에서 모두 1등급에 해당하는 성과를 거뒀으며, 영어와 한국사에서는 만점을 기록했다.
네이버클라우드는 이번 옴니모달 하이퍼클로바X를 기반으로 다양한 영역에서 활용 가능한 AI 에이전트를 단계적으로 확장하여 기술 생태계 구축에 속도를 낼 계획이라고 밝혔다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
