<이미지를 클릭하시면 크게 보실 수 있습니다> |
네이버의 인공지능 모델 '하이퍼클로바X'가 글로벌 연구자들이 구축한 다국어 AI 성능 평가 벤치마크 프로젝트에서 한국어 평가 데이터를 만드는 데 유일하게 활용된 것으로 확인됐다. 네이버는 한국어 특유의 문화적 맥락과 물리 상식을 반영하는 과정에서 자사 모델이 기여했다는 점에서 의미가 크다고 25일 밝혔다.
IT 업계에 따르면 UC샌디에이고 박사 타일러 장 연구원이 이끄는 연구팀은 '문화적 특수성이 반영된 물리적 상식 벤치마크'를 구축하는 과정에서 하이퍼클로바X의 경량 추론 모델 '시드14B 싱크'를 한국어 데이터 제작에 투입했다. 해당 연구는 이달 5일부터 9일까지 열린 자연어처리 분야 최고의 국제학술대회인 'EMNLP 2025 다국어 표현 학습 워크샵'에서 발표됐다.
연구진은 얼어붙은 장독대를 여는 법, 달고나가 부러지는 순간 등 문화적 문맥을 담은 한국어 물리 상식 문제 85개를 제작했으며, 이 과정에서 하이퍼클로바X가 주요 생성·검증 도구로 쓰였다. 연구 발표 직후 해당 모델의 다운로드 수는 글로벌 오픈소스 플랫폼 허깅페이스에서 약 5만5000건 증가했다. 네이버의 오픈소스 AI 모델은 공개 6개월 만에 누적 다운로드 200만 건도 넘긴 상태다.
네이버는 하이퍼클로바X의 한국어 이해력과 표현력이 글로벌 연구진에게 입증된 사례라고 설명했다. 네이버는 현재 텍스트·이미지·오디오·비디오를 통합해 이해·생성하는 옴니모달리티 모델 개발에 집중하고 있으며, 정부가 추진하는 '독자 AI 파운데이션 모델' 1차 지원 대상에도 선정된 바 있다.
네이버 관계자는 "이번 사례는 하이퍼클로바X가 한국어 주권성을 갖춘 소버린 AI로서 글로벌 연구 생태계에서도 가치가 입증된 성과"라며 "앞으로도 한국형 AI 기술 경쟁력을 강화하는 데 지속적으로 투자하겠다"고 말했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
