컨텐츠 바로가기

04.20 (토)

챗GPT 작동원리~ 1차함수만 알면 이해된다 [티타임즈]

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[머니투데이 홍재의 기자] 남세동 보이저엑스 대표의 초거대AI 모델 강의

챗GPT나 미드저니 같은 생성형 AI가 급격히 우리 삶 속으로 파고들면서 일하는 방식의 변화가 불가피해지고 있다. 우리의 직업이 AI기술에 의해 대체될지도 모른다는 막연한 불안감을 모두가 갖게 됐지만 전문가들의 의견은 조금 다르다. "AI 기술을 잘 활용하는 사람에게는 기회, 사용하지 못하는 사람에게는 위기가 될 것"이라는 공통된 의견이다. 그렇다면, 최근 시장을 뜨겁게 달구고 있는 생성형 AI 기술이 무엇인지를 정확하게 이해해야 이를 활용해 다른 이보다 앞서 나갈 수 있을 것이다.

누구나 쉽게 AI를 이해하고 응용, 활용할 수 있도록 남세동 보이저엑스 대표가 일타강사로 나섰다. 남 대표는 네오위즈 근무 시절 '세이클럽'을 직접 만들고 네이버 라인에서는 글로벌 인기를 끌었던 'B612' 앱 개발을 이끌었다. 현재는 AI 회사인 보이저엑스를 창업해 '브루'(vrew)와 '브이플랫'(vflat) 서비스를 선보인 바 있다.

아래는 남 대표의 '챗GPT 원리 이해하기' 강의를 요약·정리한 내용이다.



챗GPT는 LLM(거대언어모델)으로 만들었다고 하죠. 챗GPT는 GPT-3.5라고 하는 거대언어모델을 기반으로 만든 AI 채팅 서비스입니다. 이 말을 들었을 때 우선 '거대언어모델'이라는 단어부터가 매우 생소하죠.

거대언어모델에서 일단 '모델'이라는 단어부터 쉽게 이해하고 가죠. 여기서 말하는 모델은 우리가 중학교 때 배웠던 함수, 더 쉽게 말하면 수학식을 말합니다. 예를 들어 일기예보에 사용하는 '날씨 예측 모델'이 있다고 하면 이것 역시 날씨를 예측하는 함수가 있다고 볼 수 있습니다. 현재 기상상황, 온도, 습도, 위성 사진 등의 관측된 자료를 바탕으로 수학식을 거치면 미래의 날씨를 예측할 수 있는 거죠. 마찬가지로 거대언어모델을 다른 말로 하면 아주 복잡한 함수를 거쳐서 결괏값이 나오는 것이다라고 생각하면 됩니다.

머니투데이

<이미지를 클릭하시면 크게 보실 수 있습니다>



보시는 그림은 딥뉴럴 네트워크라고 하는 인공신경망입니다. 거대언어 함수라고 말씀드린 거대언어모델을 단순화 해놓은 것입니다. 원(노드)과 원을 잇는 화살표가 보이시죠. 저걸 우리는 '파라미터'라고 부릅니다. GPT-3는 1750억 개의 파라미터가 있다는 말 많이 들어보셨을텐데요 저 화살표가 1750억 개 있다는 말로 이해하시면 됩니다.

저 화살표가 하는 역할을 단순화 해서 말씀드리면 그저 '곱하기'를 하는 것 뿐입니다. 예를 들어 그림에 보이시는 원에 5라는 숫자가 들어왔다고 해보죠. 그럼 초록 화살표에서 어떤 숫자를 곱해서 다음 원으로 넘깁니다. 다음 원에는 화살표가 노란 원과 그 아랫 원 두 군데서 들어오죠. 두 군데에서 들어온 값을 단순히 더하는게 다음 원에서 하는 일입니다. 그렇게 많은 파라미터와 노드를 거치고 나면 맨 오른쪽에 출력값이라고 하는 결과가 나오는 것이죠.

머니투데이

<이미지를 클릭하시면 크게 보실 수 있습니다>



이 그림을 보시면 더 쉽습니다. 키와 나이를 알고 있을 때 그 사람의 체중과 성별을 예측하는 인공지능모델을 만든다고 해보죠. 키에서 어떤 숫자(a)를 곱해서 다음 원으로 보낼 것인지, 나이에서 어떤 숫자(d)를 곱해서 다음 원으로 넘길 것인지를 AI가 계속적으로 테스트 해보면서 a값, b값, c값, d값 등을 조절하는게 인공지능의 '학습'입니다.

마지막으로 짚고 넘어갈 부분은 인공지능의 '학습'과 '예측'입니다. 우리가 사용하고 있는 챗GPT는 인터넷에 있는 수많은 문서들을 공부해 다음 말을 예측할 수 있게 된 모델입니다. '안녕하세요'라는 말이 나왔을 때 '예' 라고 대답할지 '안녕하세요'라고 대답할지, 그리고 그 다음 말은 무엇으로 이어나갈지를 예측하게 되는 거죠. 언어로 비유하자면 너무 어려우니 조금 전에 설명드렸던 체중과 성별 예측 모델의 예로 다시 설명드리겠습니다.

여기서 말하는 '학습'은 다음과 같습니다. 인공지능이 예를 들어 '김아무개' 라는 사람이 175cm에 23세일 때 65kg 체중에 남성이라는 데이터를 갖고 있다고 해봅시다. '박아무개'라는 사람은 163cm에 25세, 50kg 체중에 여성이라는 데이터도 있죠. 이렇게 기존에 갖고 있는 데이터들을 인공지능은 '정답'으로 간주하고 학습하기 시작하죠. 175cm라는 키와 23세 라는 나이를 알게 됐을 때, 65kg에 남성이라는 정답을 찾아나갈 수 있도록 중간의 수학식들을 조절하는 것입니다.

화살표(파라미터)에 어떤 숫자를 곱해서 다음 원으로 넘기는 작업을 했을 때 정답에 딱 맞는 a값, b값, c값, d값이 뭔지를 계속 수정해나가는 거죠. 많은 사람의 데이터를 학습할수록 더 정확한 답을 찾아나갈 수 있을 겁니다.

이렇게 학습을 다 하고 나면 인공지능이 생각하는 a값, b값, c값, d값 등이 정해지게 됩니다. 그래서 우리가 그 인공지능을 사용하게 되면 AI는 정답을 '예측'하게 되죠. 180cm에 33살이라고 입력하면, 75kg의 남성이다 라고 예측해주는 것이죠. 마치 사람이 어떤 이야기를 들었을 때 오랜 세월을 통해서 축적한 경험으로 다음 일을 예측하는 것처럼 거대언어모델은 1750억개의 '곱셈'과 '덧셈'을 이용해서 자신이 말해야 할 것, 그려야 할 그림 등을 학습하고 그 결과물을 보여주는 것입니다.

※ 남세동 보이저엑스 대표가 설명하는 초거대AI 원리를 더 쉽게 듣고 싶으시면 영상을 참고해 주세요. '티타임즈TV'에 오시면 더 많은 영상을 보실 수 있습니다

홍재의 기자 hjae@mt.co.kr

ⓒ 머니투데이 & mt.co.kr, 무단 전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.