컨텐츠 바로가기

05.06 (월)

MS, 소형언어모델 '파이-3' 출시···구글·메타와 경쟁

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
전자신문

생성형 AI 매개변수 비교


마이크로소프트(MS)가 소형언어모델(SLM) '파이-3 미니'를 출시한다고 23일(현지시간) 밝혔다.

파이-3 미니는 MS가 내놓을 세 가지 SLM(미니·스몰·미디엄) 가운데 가장 경량 모델로 구글, 메타 등과 경쟁이 더욱 치열해질 전망이다.

앞서 MS는 지난해 12월 파이-2를 출시했다. 파이-3는 파이-2에 비해 성능이 더 뛰어나고, 10배 큰 모델 수준의 응답을 제공한다고 MS 측은 설명했다.

SLM은 거대언어모델(LLM)과 달리 휴대전화와 노트북 등 개인용 기기에서 작동한다. 기계학습과 구동에 드는 비용이 저렴하다.

세바스티엔 부벡 MS 생성형 인공지능(AI) 연구 담당 부사장은 “파이-3는 비용이 획기적으로 적게 든다”면서 “비슷한 기능을 가진 다른 모델들과 비교해 비용은 10분의 1 수준”이라고 설명했다.

파이-3 미니의 매개변수(파라미터)는 38억개다. 향후 출시될 매개변수 70억개의 파이-3 스몰이나 140억개의 파이-3 미디엄보다도 적다.

대표적 생성형 AI인 챗GPT의 기반이 되는 LLM 'GPT-4'의 경우 매개변수가 5000억개로 추정된다. 매개변수는 AI 모델이 복잡한 명령어를 얼마나 많이 이해할 수 있는지를 나타낸다.

SLM은 단순 작업을 수행할 수 있도록 설계됐고, 한정된 자원을 가진 기업들이 보다 쉽게 사용 가능하다고 MS 측은 설명했다.

에릭 보이드 MS 애저 AI 플랫폼 부사장은 “파이-3는 이전 버전에서 학습한 내용을 기반으로 만들어졌다”면서 “파이-1은 코딩에 중점을 뒀고 파이-2는 추론을 배우기 시작했으며, 파이-3는 코딩과 추론에 더욱 능숙하다”고 말했다.

MS가 새로운 SLM을 출시함에 따라 시장 경쟁은 더욱 치열해질 전망이다.

구글은 지난 2월 간단한 언어 관련 작업에 유용한 '젬마 2B·7B'를 출시했다.

메타는 지난 18일 '라마3'를 출시하면서 파라미터가 700억개인 LLM과 함께 챗봇과 코딩 지원에 사용되는 파라미터 80억개인 소형 모델을 동시에 선보였다.

AI 스타트업인 앤스로픽도 그래프를 포함한 연구 논문을 읽고 요약 가능한 '클로드 3 하이쿠'를 출시한 바 있다.

류태웅 기자 bigheroryu@etnews.com

[Copyright © 전자신문. 무단전재-재배포금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.