컨텐츠 바로가기

12.05 (목)

모레, 자체 개발 한국어 LLM 파운데이션 모델 'Motif' 오픈소스 공개

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

전문 분야 문서 학습에 활용

"한국 AI 생태계 발전에 기여"

인공지능(AI) 인프라 솔루션 기업 '모레'는 자체 개발한 한국어 거대언어모델(LLM) 파운데이션 모델인 Llama-3-Motif-102B(이하 Motif)를 3일 오픈소스로 공개했다.
아시아경제

<이미지를 클릭하시면 크게 보실 수 있습니다>


한국어 LLM 파운데이션 모델을 누구나 활용할 수 있도록 소스 코드까지 공개하는 것은 국내 AI 산업 발전에 있어 큰 의미를 가진다. 자국어 전문 AI 역량 확보는 소버린 AI의 필수요소이기 때문이다.

모레는 허깅페이스에 고성능 한국어 LLM을 오픈소스로 배포해 한국 AI 생태계 성장에 기여한다는 계획이다. 이를 위해 AI 모델 사업 본격 추진을 위한 자회사도 설립할 예정이다.

모레 측은 "Motif는 1020억개의 매개변수(파라미터)를 가진 한국어 LLM"라며 "한국판 AI 성능 평가 체계인 'KMMLU' 벤치마크에서 64.74점을 기록하며 메타나 구글, 네이버의 LLM 보다도 뛰어난 한국어 처리 성능을 입증했다"고 밝혔다.

Motif는 웹상에서 수집 가능한 글뿐만 아니라 국내 특허 및 연구 보고서 등 공개된 전문 분야 문서를 학습 데이터로 활용했다. 또한 국내 최대 규모의 한국어 정제 데이터를 확보해 학습에 포함시켰다. 사전 훈련된 언어모델과 지시사항을 따르는 데 특화된 인스트럭트 모델 2가지 버전의 오픈소스가 공개된다.

조강원 모레 대표는 "고성능 LLM을 누구나 활용할 수 있도록 오픈소스로 공개하는 것은 국내 AI 생태계 성장과 소버린 AI에 기여하기 위함"이라며 "AI 산업 발전을 위해 노력하는 스타트업 등 많은 기업들이 적극 활용하길 바란다"고 말했다.

모레는 AI 인프라 소프트웨어 기술력을 바탕으로 지식재산(IP) 산업과 같은 창작의 영역을 비롯해 의료, 법률, 금융 등에 특화된 LLM을 개발하고 멀티모달형 모델 개발에 나서는 등 AI 모델 허브를 목표로 사업을 추진한다는 계획이다.

김보경 기자 bkly477@asiae.co.kr
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.