컨텐츠 바로가기

    01.01 (목)

    이슈 IT기업 이모저모

    네이버클라우드, 옴니모달 AI 공개…수능 영어·한국사 만점

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    머니투데이

    ‘HyperCLOVA X SEED 32B Think’의 영역별 벤치마크 점수./사진제공=네이버클라우드

    <이미지를 클릭하시면 크게 보실 수 있습니다>



    네이버클라우드가 개발한 새 옴니모달 AI(인공지능) 파운데이션 모델이 올해 수능 영어와 한국사 과목에서 만점을 맞았다. 국어·수학 등 다른 과목에서도 1등급을 받았다. 기존 AI 모델과 달리 문제를 텍스트로 변환해 입력하지 않고, 이미지를 직접 넣어 '옴니모달' 능력을 입증했다.

    네이버클라우드는 과학기술정보통신부 '독자 AI 파운데이션 모델' 프로젝트 주관 사업자로서 추진 중인 '옴니(Omni) 파운데이션 모델' 개발 과제의 첫 번째 성과를 29일 공개했다.

    네이버클라우드는 국내 최초로 네이티브 옴니모달 구조를 적용한 파운데이션 모델 '네이티브 옴니모델'(HyperCLOVA X SEED 8B Omni)과 기존 추론형 AI에 시각·음성·도구 활용 역량을 더한 '고성능 추론모델'(HyperCLOVA X SEED 32B Think)을 각각 오픈소스로 공개했다.

    HyperCLOVA X SEED 8B Omni는 네이티브 옴니모달 구조를 전면에 적용해 구축됐다. 네이티브 옴니모달은 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 방식이다. 네이버 클라우드는 기존 인터넷 문서나 이미지 중심 학습을 넘어 현실 세계의 다양한 맥락을 담은 데이터 확보에 집중해 옴니모달 AI의 잠재력을 극대화한다는 전략이다.

    성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "모델을 대규모로 키워도 데이터 다양성이 한정돼있다면 AI의 문제 해결 능력도 특정 영역·과목에만 집중된다"고 설명했다.

    네이버클라우드는 향후 옴니모달 AI 에이전트 활용 가능성을 검증하기 위해 고성능 추론모델(HyperCLOVA X SEED 32B Think)을 추가로 공개했다. 자체 추론형 AI에 시각 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 입력과 요청을 이해하고 문제를 해결하는 옴니모달 에이전트 경험을 구현했다.

    이 모델은 글로벌 AI 평가 기관 아티피셜 애널리시스(Artificial Analysis)가 종합 지식·고난도 추론·코딩·에이전트형 과제 등 10개 주요 벤치마크를 종합해 산출한 지수 기준에서도 글로벌 주요 AI 모델들과 유사한 성능 범위에 위치한 것으로 나타났다.

    영역별 평가에서는 특히 실사용과 밀접한 항목에서 경쟁력을 보였다. 한국어 기반 종합 지식, 시각 이해, 실제로 도구를 활용해 문제를 해결하는 에이전트 수행 능력 등 주요 능력 항목에서 글로벌 모델들과 비교해 우수한 성능을 기록했다.

    성 총괄은 "텍스트·시각·음성 등 AI의 감각을 수평적으로 확장하는 동시에 사고와 추론 능력을 함께 강화했을 때 현실 문제 해결력이 크게 높아진다는 점을 확인했다"며 "이러한 기본기를 갖춘 구조 위에서 점진적으로 규모를 확장해야 실제로 쓰임새 있는 AI로 발전할 수 있다"고 말했다.

    이찬종 기자 coldbell@mt.co.kr

    Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.