컨텐츠 바로가기

    12.10 (수)

    [김정호의 AI시대 전략] 인공지능은 ‘오픈북 시험’으로 학습, 학교는 여전히 ‘암기 능력’ 테스트

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    조선일보

    그래픽=이철원

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    인공지능이 작동하는 방식은 크게 두 단계로 나뉜다. 먼저 인공지능망의 매개변수를 정해가는 ‘학습’을 한다. 이때 학습용 데이터와 컴퓨터가 필요하다. 컴퓨터에는 GPU, TPU 같은 프로세서, 그리고 HBM 같은 메모리 반도체가 대량으로 필요하다. 다음 단계로 ‘추론’이 있다. 인간의 요청, 즉 프롬프트(Prompt)에 맞추어 결과물인 출력을 생성한다. 이때 수만 혹은 수억 명이 동시에 접근할 수도 있어 강력한 컴퓨팅 파워와 메모리가 요구된다. 이때 생성물은 텍스트에 그치지 않고 음성, 음악, 동영상이 함께 동기화돼 마치 영화처럼 만들어진다. 이를 멀티모달(Multi-modal) 생성이라 부른다. 3분짜리 광고 동영상을 1초 만에 뚝딱 만드는 세상이 코앞에 와 있다.

    인공지능 학습의 과정도 4단계로 나뉜다. 먼저 사전 학습(Pre-training)이다. 기존에 나온 자료를 이용해 습득하는 과정으로, 대학생 수준의 학습과 같다. 다음으로 검증을 받고 교정을 받는 작업이 있다. 이를 ‘인간 검증 강화 학습(RLHF: Reinforcement Learning by Human Feedback)’이라 부른다. 도덕적으로 문제 있는 질문과 내용은 거른다. 인간이 유일하게 직접 관여하고 영향을 미치는 단계다. 세번째는 추가학습(Post-training)으로 전문교육을 실시한다. 이 과정을 거치면 예컨대 변호사나 의사 인공지능이 나온다. 대학원 교육과 유사하다. 마지막 학습이 최근 주목받고 있는 ‘실시간 학습’이다.

    실시간 학습의 대표적인 방법이 탐색 강화 생성(RAG: Retrieved Augmented Generation) 기법이다. 기존 인공지능은 방금 전 사건과 뉴스에 대해 물어보면 답할 수가 없다. 수 개월 전에 사전학습을 했기 때문이다. RAG에서는 질문이 들어오면 최신 자료를 인터넷에 찾거나 보유하고 있는 관련 자료를 이용해 추가로 실시간 학습을 하고 이를 이용해 최신 보고서나 이미지, 동영상을 즉시 생성한다. 기존의 생성 인공지능 능력과 실시간 탐색 능력이 합쳐진 새로운 생성 방식이다. 실시간 뉴스, 주가, 날씨 등 변화하는 정보에 대해 정확한 답변이 가능하다.

    나아가 생성 보고서에 자료 출처를 제공해 신뢰도를 높인다. 이렇게 하면 할루시네이션(Hallucination·환각) 현상도 줄일 수 있다. RAG를 활용하는 대표적 인공지능이 ‘퍼플렉시티(Perplexity)’다. 주로 정확한 학술 정보와 출처를 찾는 데 사용하고 있다. 이러한 이유로 탐색 기능과 데이터베이스를 많이 가진 기업이 유리하다. 유튜브 사업으로 막대한 동영상 데이터를 확보한 구글이 멀티모달 생성 인공지능 시장에서 독보적인 이유다.

    실시간 학습의 진화는 여기서 멈추지 않는다. 구글 ‘제미나이(Gemini)’를 이용해 발표 자료를 만든다고 가정하자. 이럴 경우 참고할 자료·그림·사진을 첨부해 입력한다. 의도하는 방향과 더불어 이전에 생성한 자료를 입력할 수도 있다. 그러면 인공지능은 기존의 학습 결과뿐만 아니라 새로운 자료도 실시간 학습하면서 사용자의 의도를 최대한 반영한 결과물을 생성한다. 심지어 요청한 사람이 이전에 만든 생성 자료를 참고해 새로운 이미지를 생성하기도 한다. 마치 취향을 공유하는 최적의 그래픽 디자이너를 옆에 고용한 효과가 있다. 인공지능이 기존의 ‘사전 학습된 정적 지식’ 기반에서 ‘실시간 동적 지식’ 학습 방식으로 근본적 전환을 실현해 가고 있는 것이다.

    이러한 실시간 학습 기반 인공지능 생성 방식은 학교의 ‘오픈북 시험’과 유사하다고 볼 수 있다. 사전 학습으로 외워서 쓰는 방식이 아니라 옆에 참고도서를 쌓아 두고 빠르게 보면서 답안을 작성하는 방식인 셈이다. 오픈북 시험은 정보의 종합과 분석 능력 그리고 자신만의 주장을 수립하는 능력을 테스트한다. 이때 중요한 것은 질문에 해당하는 책 내용을 정확히 빠르게 찾아 정리하는 효율적인 검색 능력이다. 오픈북 시험에 더 많은 자료를 활용하려면 도서관에 앉아 관련 서적을 빠르게 찾아서 시험을 볼 수도 있다. 이때 책상 옆의 참고 도서가 HBM(고대역폭 메모리)이고, 도서관 서가의 책들이 HBF(고대역폭 플래시) 메모리가 된다.

    지금의 학교 시험은 아쉽게도 일종의 기억력 테스트다. 특히 OMR 카드를 이용해 정해진 시간 안에 정해진 답을 찾는 시험을 보는 것은 인공지능 시대에 대단한 모순이다. 정답이 있는 문제에 대해 인간은 정확성과 속도, 기억력에서 더 이상 인공지능과 경쟁할 수 없다. 백전백패의 게임이다. 궁극적으로 인간은 ‘창의력’ ‘종합력’ ‘융합력’ ‘분석력’에서 인공지능을 앞서야 한다. 아직은 인공지능이 이 능력을 완벽히 구현하는 데 필요한 학습용 데이터의 크기와 컴퓨팅 파워가 어마어마한 전기와 비용을 요구하기 때문이다. 인간의 교육 방향과 시험 방향은 이쪽으로 나아가야 한다.

    생성형 인공지능 시대에 맞게 학교 시험 방식도 대대적인 변화가 필요한 시점이다. 인공지능을 자유롭게 사용하게 하고, 창의적으로 자료를 정리해 보고서를 작성하며, 최종적으로는 인간 앞에서 자신의 의견과 생각을 인간의 목소리로 발표하고 평가받는 방식으로 전환돼야 한다. 인공지능을 도구로 활용하면서 인간과의 문답을 통해 본인의 논리를 정립하고 설득하는 능력이 중요하다. 인공지능의 발전은 출산율 감소와 함께 학교 교육의 위기를 가속화하는 거스를 수 없는 파도가 되고 있다.

    매일 조선일보에 실린 칼럼 5개가 담긴 뉴스레터를 받아보세요. 세상에 대한 통찰을 얻을 수 있습니다.

    '5분 칼럼' 더보기

    [김정호 KAIST 전기·전자공학과 교수]

    - Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.