컨텐츠 바로가기

05.04 (토)

"비용 10분의 1 수준"…MS, 소형언어모델 '파이-3 미니' 출시

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
머니투데이

마이크로소프트(MS)가 23일(현지시간) 인터넷 연결 없이 스마트폰에서 사용할 수 있는 소형언어모델(SLM) '파이-3 미니'를 출시했다. MS는 자체 개발한 이 소형언어모델을 오픈AI의 대규모언어모델(LLM) 기반 생성형 인공지능(AI) 모델 '챗GPT'와 함께 제공해 생성형 AI 체계를 강화하겠다는 방침이다. /로이터=뉴스1

<이미지를 클릭하시면 크게 보실 수 있습니다>



마이크로소프트(MS)가 인터넷 연결 없이 스마트폰에서 사용할 수 있는 소형언어모델(SLM)을 출시했다. MS는 자체 개발한 이 소형언어모델을 오픈AI의 대규모언어모델(LLM) 기반의 생성형 인공지능(AI) 모델 '챗GPT'와 함께 제공해 생성형 AI 체계를 강화하겠다는 방침이다.

23일(현지시간) 더버지 등에 따르면 MS는 자체 개발한 소형언어모델 '파이-3 미니(Phi-3 Mini)'를 출시한다고 밝혔다. '파이-3 미니'는 MS가 출시를 예고한 3가지 소형언어모델 중 가장 경량 모델이다.

파이-3 미니는 38억개의 매개변수를 측정한다. 매개변수는 AI 모델이 얼마나 많은 복잡한 명령어를 이해할 수 있는지를 보여주는 수치로, '파이-3 미니'의 규모는 향후 출시될 '파이-3 스몰(Small)'과 '파이-3 미디엄(Medium)'보다 적다. 두 모델이 측정하는 매개변수는 각각 70억개, 140억개다. 대규모언어모델인 'GPT-4'의 매개변수는 5000억개로 추정된다.

MS는 파이-3가 이전 버전보다 성능이 더 뛰어나고, 10배 큰 모델 수준의 응답을 제공할 수 있다고 했다. 지난해 출시된 '파이-2'는 메타플랫폼이 개발한 대규모언어모델 '라마2'만큼 성능이 좋았다고 더버지는 설명했다. 에릭 보이드 MS 애저 AI 플랫폼 부사장은 더버지에 "파이-3 미니는 더 작은 폼팩터일 뿐"이라며 GPT-3.5와 같은 대규모언어모델만큼의 성능을 발휘한다고 전했다.

MS는 또 소형언어모델이 단순 작업을 수행할 수 있도록 설계돼 한정된 자원을 가진 기업들이 더 쉽게 사용할 수 있고, 비용도 상당히 저렴하다고 강조했다. 세바스티엔 부벡 MS 생성형 AI 연구 담당 부사장은 "파이-3은 약간이 아니라 획기적으로 비용이 적게 든다. 비슷한 기능을 가진 다른 모델들과 비교하면 비용이 10분의 1 수준"이라고 말했다.

더버지는 "소형언어모델은 대규모언어모델에 비해 실행 비용이 저렴하고 스마트폰이나 노트북과 같은 개인용 디바이스에서 더 나은 성능을 발휘하는 경우가 많다"며 더인포메이션 보도를 인용해 "MS는 소형언어모델 개발에 더 초점을 맞춘 팀을 구성했다"고 전했다.

외신은 기술업계가 AI 열풍에 따라 대기업 외에 중소기업이 더 쉽게 AI에 접근하도록 소형언어모델 개발에도 초점을 맞추고 있다며 관련 경쟁도 심화할 것으로 전망했다.

니혼게이자이신문은 기업들의 소형언어모델 개발은 소비자들이 용도에 따라 생성형 AI 모델을 선택할 기회가 늘어나는 것이라고 진단했다. 구글은 지난 2월 간단한 챗봇과 언어 관련 작업에 유용한 젬마(Gemma) 2B와 7B를 출시했고, 메타는 지난 18일 소형언어모델 '라마3'를 공개했다.

정혜인 기자 chimt@mt.co.kr

ⓒ 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.