컨텐츠 바로가기

    12.31 (수)

    네이버 AI 모델 "수능 주요 과목 1등급"...글·사진·음성 동시 이해

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    네이버클라우드, 옴니·추론모델 공개
    "독자 인공지능 파운데이션 첫 성과"


    한국일보

    텍스트와 이미지의 맥락을 함께 이해해 결과물을 만들어내는 네이버의 HyperCLOVA X SEED 8B Omni 모델. 네이버클라우드 제공

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    네이버가 텍스트와 이미지, 음성을 동시에 이해하는 옴니모달 인공지능(AI) 모델을 내놨다.

    네이버클라우드는 29일 국내 최초로 네이티브 옴니모달 구조를 적용한 AI 모델('하이퍼클로바 X 시드 8B 옴니')을 오픈소스로 공개했다. 과학기술정보통신부의 '독자 AI 파운데이션 모델' 프로젝트의 주관 사업자로서 추진 중인 모델 개발 과제의 첫 성과라고 했다.

    옴니모달은 텍스트와 이미지, 오디오 등 서로 특성이 다른 데이터를 처음부터 한 번에 함께 학습하고 이해하면서 결과물을 생성하는 AI 모델을 뜻한다. 말이나 글 같은 단일 데이터를 중심으로 학습한 뒤 이미지 등을 추가로 결합해 학습하는 '멀티모달' 방식보다 한층 진화한 차세대 기술이다. 정보의 형태가 달라지더라도 하나의 공간에서 맥락을 통합적으로 이해할 수 있어 멀티모달 식보다 상황 이해력이 높다. 시각과 음성 정보가 복합적으로 오가는 현실 환경에서 활용도가 높은 AI 기술로 주목받고 있다.

    네이버클라우드는 옴니모달 AI의 잠재력을 끌어올리려 다양한 데이터 확보에 집중한다는 방침이다. 성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "데이터 다양성이 제한되면 AI의 문제 해결 능력도 특정 영역에만 그친다"며 "디지털화하지 않은 생활 맥락이나 지리적 특성이 반영된 공간 등 차별화한 현실 세계의 데이터를 확보하는 과정이 선행돼야 한다"고 설명했다.

    네이버클라우드는 기존 추론형 AI에 시각과 음성, 도구 활용 능력을 결합해 복합적 문제를 해결하는 고성능 추론모델('하이퍼클로바 X 시드 32B 씽크') 오픈소스도 선보였다. 이 모델로 올해 대학수학능력시험 문제를 풀었더니 국어와 수학, 영어, 한국사 등 주요 과목에서 모두 1등급을 받았다고 회사 측은 설명했다.

    손현성 기자 hshs@hankookilbo.com

    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.