컨텐츠 바로가기

10.27 (일)

신재민 트릴리온랩스 대표 "데이터 기술로 고효율 한국어 파운데이션 모델 구축할 것"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박수빈 기자]
AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


신재민 대표가 네이버를 나와 지난 4월 트릴리온랩스를 설립하고 '한국어 파운데이션 모델'을 만들겠다고 밝히자, 주변에서는 많은 의문이 모였다.

파운데이션 모델 구축은 대기업도 산뜻 나서기 꺼릴 정도로 큰 작업이다. 오픈 소스 모델을 미세조정하는 것과는 기술과 시간, 비용이 비교되지 않을 정도로 많이 들어간다.

하지만 신재민 대표는 곧 프리 시드 자금으로 57억원을 유치했다. 스트롱벤처스, 카카오벤처스, 베이스인베스트먼트, 더벤처스 등 국내 투자사들과 굿워터캐피탈, 뱀 벤처스 등의 미국 투자사들이 참여했다.

설립 수개월 만에 6명의 멤버만으로 57억원을 모으기는 쉽지 않다. 특히 미국 투자사까지 참여할 정도로, 이 회사의 기술력을 높게 샀다.

물론 LLM 개발을 위해서는 그야말로 시드 머니에 불과하다. 파운데이션 모델 구축은 성능을 높이려고 맘먹기에 따라 수백억원을 투입하고도 모자랄 수 있다.

신 대표는 이를 기술로 풀어내겠다고 밝혔다. 데이터 효율성과 합성 데이터로 고효율의 모델을 구축하겠다는 것이다.

"LLM을 개발하기 위해 데이터, 알고리즘, 인프라 모두 우열을 가릴 수 없이 중요하다"라며 "그중에서도 트릴리온랩스의 핵심 기술은 데이터 효율성을 극대화하는 것에 있다"라고 강조했다. 또 양질의 한국어 데이터가 절대적으로 부족한 상황을 극복할 수 있는 방법으로 합성 데이터를 꼽았다.

그는 2017년부터 자연어처리(NLP)와 합성 데이터를 연구해온 국내 대표 연구원 중 한명이다. 다년간 세계 권위의 자연어 처리 학회인 ACL, EMNLP와 AI학회 ICLR 등에 다수의 논문을 발표했다.

파운데이션 모델 구축에 집중하는 이유는 간단하다. "AI 엔진을 한국어로 개발해야 한국어 이해 능력과 정확성이 향상된다"라는 신념 때문이다. "기존의 오픈 소스 모델을 미세조정하는 방식은 중간에 번역 과정을 거치는 등 비효율적"이라며 "똑똑한 미국인에게 한국어를 가르쳐 일을 시키는 것과 같다"라고 표현했다.

이어 "한국어로 만들어진 기반 모델을 개발하는 것은 국내 기업들에게 최적화된 AI 모델 개발을 위한 뼈대(Back bone)를 제공하는 것"이라고 설명했다. 즉, 한국어 최적화 파운데이션 모델을 만들면, 기업들이 도메인 최적화와 소형화, AI서비스 개발 등에 자유롭게 사용할 수 있을 것이라는 말이다.

한국어 뿐만 아니라 동아시아 언어 데이터도 학습할 계획이다. 특히 중국어와 일본어 등 한자 문화권 데이터를 학습에 이용해야 한국어 성능도 좋아진다고 설명했다.

그는 목표를 이루기 위해 갈길이 많이 남았다는 것을 인정했다. "국내 시장의 규모가 작다거나, 적은 투자금으로 빅테크들과의 경쟁에서 이길 수 없다는 의견이 있다는 것을 알고 있다"라고 말했다.

하지만 "공공 분야나 의료 분야처럼 국내 AI모델을 사용할 수 밖에 없는 시장이 있기 때문에 반드시 파운데이션 모델을 개발할 필요가 있다"라고 거듭 밝혔다.

현재는 모델 학습을 위해 확보한 GPU를 세팅하는 중이라고 밝혔다. "예정대로 진행된다면 2025년 1분기에 첫 모델을 공개할 수 있을 것"이라고 전했다.

그는 인터뷰 중 전 직장에서 함께 일했던 하정우 네이버 AI센터장을 여러번 "멘토"라고 부르며 고마움을 표현했다. "네이버를 그만 두고 스타트업에 도전하는 과정에서 많은 조언과 응원을 들었다"라고 밝혔다.

국내 최고 AI 기업에서 나와 새로운 도전에 나선만큼, 목표는 네이버보다 더 좋은 모델을 만드는 것이라고 전했다.

그는 마지막으로 "네이버 서비스보다 좀 더 범용적으로 쓸 수 있는 한국형 LLM을 만들기 위해 노력할 것"이라고 강조했다.

박수빈 기자 sbin08@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.