컨텐츠 바로가기

    12.12 (금)

    '구글 등장에 깜짝' 챗GPT 한달만에 새 버전 공개…불붙은 AI 대전

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    머니투데이

    /제미나이 3.0 제작 이미지

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    구글의 인공지능(AI) 챗봇 제이나이 3.0 프로 출시 이후 자존심을 구겼던 챗GPT 개발사 오픈AI가 기존 버전을 내놓은 지 불과 한달 만인 11일(현지시간) 새 버전 'GPT-5.2'를 내놨다. 당초 새 버전을 이달 말 선보일 예정이었지만 제미나이 3.0 프로가 강력한 성능을 앞세워 시장을 뒤흔들자 출시를 앞당긴 것으로 전해졌다.

    오픈AI가 이날 선보인 GPT-5.2 시리즈는 전문적인 지식 업무 수행에 최적화된 모델로 기존의 버전의 즉답, 사고 모드에 프로 모드가 더해졌다.

    즉답 모드는 일상적인 업무와 학습을 위한 빠른 답변에 최적화된 기능이고 사고 모드는 코딩이나 수학적 해결, 긴 문서 요약 등에 적합하다. 추가된 프로 모드는 더 긴 작업시간이 필요한 고난도의 질문에 적합하다고 오픈AI는 밝혔다.

    오픈AI는 또 새로운 버전에서 추론과 코딩 능력을 강화하면서 AI 성능을 측정하는 다양한 벤치마크에서 최고 수준을 달성했다고 소개했다.

    전문 산업 현장 44개 직종의 업무 수행 능력을 평가하는 GDPval 평가에서 GPT-5.2 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가들과 대등하거나 더 뛰어난 능력을 갖춘 것으로 평가됐다. 이전 버전인 GPT-5가 38.8%를 기록했던 것과 견줘 성능이 대폭 개선됐다.

    소프트웨어 엔지니어링 능력을 평가하는 SWE 벤치마크에서는 80%를 기록해 제미나이 3.0 프로의 76.2%를 넘어섰다. 코딩 능력이 뛰어난 것으로 알려진 앤트로픽의 클로드 오퍼스4.5(80.9%)와 비슷한 수준이다.

    '인간의 마지막 시험'으로 불리는 박사급 추론능력 측정 벤치마크 HLE에서도 검색 등 도구를 사용해 진행한 평가 결과 50%로 제미나이 3.0 프로(45.8%)보다 더 높은 점수를 얻었다. 다만 별도 도구를 사용하지 않고 모델 자체의 능력만으로 진행한 평가에서는 GPT-5.2 프로가 36.6%로 제미나이 3.0 프로(37.5%)보다 다소 낮은 평가를 받았다.

    오픈AI는 내부 테스트 결과 GPT-5.2 사고 모드의 오류율은 6.2%로 기존 모델인 GPT-5.1 사고 모드(8.8%)와 견줘 신뢰도가 30% 이상 높아졌다고 밝혔다.

    긴 글의 맥락을 파악하는 능력이나 그래프를 비롯한 그림과 사진을 인식하는 능력, 다단계 업무의 해결 능력 등도 향상됐다.

    GPT-5.2는 유료 요금제 구독자에게 이날부터 순차적으로 제공된다. 개발자들도 API를 통해 이용할 수 있다. 새 버전 출시에 따라 이전 버전인 GPT-5.1은 3개월 후 서비스를 종료한다.

    샘 올트먼 오픈AI 최고경영자(CEO)는 구글의 제미나이 3.0 프로 출시 이후 지난 2일 '코드레드'(중대경보)를 발령하면서 챗GPT 성능과 사용성 개선에 집중하라고 주문했다. 오픈AI는 내년 1월 또다시 새로운 모델을 선보일 예정이라고 월스트리트저널(WSJ)이 보도했다.

    뉴욕=심재현 특파원 urme@mt.co.kr

    Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.