컨텐츠 바로가기

03.29 (금)

[스브스뉴스] 당신은 이 AI보다 수능 점수가 높습니까? / 오목교 전자상가 EP.117

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
최신형 AI가 수능을 치를 수 있다면 과연 몇 등급을 맞을 수 있을까요? GPT 3.5 모델 기반의 최신형 인공지능 챗봇 Chat-GPT가 최근 큰 화제를 얻고 있습니다. 이 챗봇이 내놓는 답변이 인간의 답변과 구분하기 어려울 정도로 유사하기 때문입니다. 인간의 언어를 '제대로' 이해하고 답변을 하는 것 같은 인공지능 챗봇의 출현, 오목교 전자상가 팀은 호기심이 생겨 이 AI의 '언어 이해도'를 '수능' 점수로 확인해봤습니다. 이 Chat-GPT는 수능 '국어' 지문의 경우 너무 길어 풀지 못하지만, 영어 지문은 풀 수 있기 때문에 일단 '영어' 점수부터 확인해봤는데요, 놀랍게도 정답률이 최대 '71%'를 기록했습니다. (이 정답률을 영어 듣기의 경우 AI 음성 인식 기능을 이용해 얻은 텍스트를 입력하는 방식으로 정답을 확인했고, '그림'과 '그래프' '표'는 풀지 못하는 것으로 가정했을 때의 수치입니다) 예상외로 낮다고요? 이 AI의 정답률을 기반으로 등급을 추정해보면 이 ChatGPT는 3~4등급, 수험생의 50%가량이 이 AI보다 낮은 점수를 받는다는 계산이 나옵니다. 국어와 영어가 문제에 섞여있어 "AI에게 까다로운" 수능 영어 시험이 아닌 토익 시험은 어떨까요? 모의 토익 RC 부문을 쳐보니, 정답률이 85%까지 치솟습니다. 토익 점수 환산표를 적용해보면 이 AI의 예상 RC 점수는 390점, LC에서 비슷한 능력을 가지고 있다고 가정하면 무려 780~800점에 달하는 점수를 받는다는 결론이 나오죠. 이 정도의 언어 능력을 갖추고 있다 보니, 간단한 비즈니스 메일은 언어를 가리지 않고 작성이 가능합니다. 주제만 알아서 '던져주면' 형식에 맞춰 메일을 작성할 뿐 아니라 '편지의 톤을 더 정중하게 써달라'고 부탁하면 더 정중하게 표현을 바꿔주기까지 합니다. 내년에는 이보다 더 발전한 인공지능 모델 GPT-4가 출현할 예정이라는데, 과연 그 미래는 어떻게 될까요? 오목교 전자상가 팀에서 태어난 지 열흘도 채 지나지 않은 최신형 AI Chat-GPT의 능력을 체험해봤습니다.