[팩플] AI 추론능력 강화하는 빅테크, AI 에이전트 시대 ‘성큼’

중앙일보 원문
윤상언
입력

2024.12.22 15:58

주소복사가 완료되었습니다

(왼쪽부터) 오픈AI의 마크 첸 수석부사장과 샘 올트먼 최고경영자(CEO)가 지난 20일(현지시간) 온라인 간담회에서 차세대 인공지능(AI) 모델인 'o3(오쓰리)'와 'o3 미니' 출시 계획을 공개하고 있다. 사진 오픈AI 유튜브 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>

오픈AI와 구글 등 글로벌 빅테크들이 추론능력을 강화한 차세대 인공지능(AI) 모델을 연이어 내놓고 있다. 여러 단계별 복잡한 사고를 거쳐 답을 도출해 내는 ‘똑똑한 AI’가 많아지면서 이용자의 단순한 명령 한 마디에 업무를 대신 수행하는 AI 에이전트(비서)의 시대도 가까워지고 있다.

━

무슨 일이야

오픈AI는 지난 20일(현지시간) 온라인 간담회를 열고 차세대 AI 모델 ‘o3(오쓰리)’와 ‘o3 미니’의 출시 계획을 공개했다. o3 미니는 o3보다 성능은 떨어지지만, 연산 자원을 덜 소비하는 경량화 모델이다. 샘 올트먼 오픈AI 최고경영자(CEO)는 이날 “내년 1월 말 o3 미니를 출시하고, o3는 그 이후 가까운 시기에 출시할 계획”이라고 말했다. 이어 “o3 미니는 AI 안전성 시험을 목적으로 별도 신청을 통해 선발된 일부 연구자에게 미리 공개한다”고 덧붙였다.

오픈AI에 따르면 이날 공개한 o3는 이전 AI 모델보다 수학·과학 분야의 지식과 고급 추론 능력이 향상됐다는 특징을 지녔다. 미국 수학경시대회인 AIME 시험에서 96.7%의 정확도를 기록했고, 박사 학위 수준의 생물학·물리학·화학 지식을 가늠하는 AI 성능시험 ‘GPQA 다이아몬드’에서는 87.7%의 정확도를 보였다. 최신 모델인 ‘o1(오원)’의 정확도는 각각 83.3%와 78%였다. IQ 테스트와 유사한 ‘도형 유추’ 문제 등을 통해 AI의 고급 추론능력을 시험하는 ‘아크 AGI(ARC-AGI)’ 시험에서도 o3는 87.5%의 정확도를 기록했다. 시험을 개발한 아크프라이즈 재단의 그렉 캄라드 회장은 이날 “(아크 AGI 시험에서) 인간의 정확도는 85%정도로 나온다”며 “이를 넘어선 AI 모델은 과거에 없었기에 (오픈AI는) 무척 중요한 이정표를 달성한 것”이라고 말했다.

오픈AI에 따르면 o3(오쓰리)는 미국 수학경시대회인 AIME 시험에서 96.7%의 정확도를 기록했다. 박사학위 수준의 생물학 물리학 화학 지식 수준을 가늠하는 AI 전용 성능시험인 ‘GPQA 다이아몬드’에서는 87.7%의 정확도를 나타냈다. 현재 오픈AI의 최신 모델인 ‘o1(오원)’의 정확도는 78%였다. 사진 오픈AI 유튜브 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>

앞서 구글도 지난 10일(현지시간) 추론 능력을 강화한 차세대 AI 모델 ‘제미나이 2.0’을 발표했다. 앞으로 해당 기술을 검색 서비스와 결합해 고급 수학 방정식, 코딩 등 복잡한 질문에도 정확한 답을 내놓을 수 있도록 서비스를 발전시킬 예정이다. 구글 서비스가 탑재된 스마트폰 카메라에도 제미나이 2.0을 연동시킨 서비스를 내놓는다는 구상이다. 순다 피차이 구글 CEO는 “(제미나이 2.0 출시로) ‘범용 어시스턴트(universal assistant)’라는 비전에 가까이 다가갈 수 있게 됐다”고 말했다.

━

왜 중요해

빅테크들이 경쟁적으로 자사 AI 모델의 추론 능력을 강화하면서 이용자의 단순 명령에도 복잡한 과업을 수행할 수 있는 AI 에이전트 개발 속도는 한층 더 빨라질 전망이다. AI 에이전트에는 고급 추론능력을 갖춘 AI 모델이 필요하다. 스스로 이용자의 명령을 분석해 적절한 도구를 찾고, 정확한 결과를 도출하는 다층적 사고를 할 수 있어야 하기 때문이다. 예컨대 “기차표를 예약해 달라”는 단순 명령에 스스로 적절한 서비스를 검색해 원하는 시간에 기차표를 예약하는 등 복잡한 업무를 수행하는 식이다.

구글은 차세대 인공지능(AI) 모델 제미나이 2.0를 지난 5월 개최한 연례 개발자 회의 I/O에서 선보인 AI 에이전트 '프로젝트 아스트라’에 결합할 예정이다. 사진은 구글이 프로젝트 아스트라와 제미나이 2.0과 결합한 사용례. 사진 구글 유튜브 캡처

<이미지를 클릭하시면 크게 보실 수 있습니다>

글로벌 시장조사업체 마켓앤마켓에 따르면, AI 에이전트 시장은 올해 51억달러(약 7조4000억원)에서 2030년 471억달러(약 68조3000억원)로 성장할 전망이다. AI 분야의 유명 석학인 앤드류 응 스탠퍼드대 컴퓨터공학과 겸임교수는 지난 5월 외신 인터뷰에서 “올해 AI 에이전트가 차세대 대규모언어모델(LLM)보다 큰 AI 발전을 주도할 것”이라고 말했다.

━

더 알면 좋은 것

또 다른 빅테크인 메타도 내년 중 추론 능력을 강화한 차세대 AI 모델 ‘라마(Llama) 4’를 출시할 계획이다. 아흐마드 알 달레 메타 생성AI 부문 부사장은 지난 19일(현지시간) 자사 블로그에서 “라마 4는 음성 인식과 고급 추론 분야 등 전반적인 분야에서 (이전 모델보다) 큰 발전이 있을 것”이라며 “내년에는 고급 추론 기능을 갖춘 AI 에이전트 체계를 개발할 중요한 기회가 있을 것으로 예상된다”고 말했다.

윤상언 기자 youn.sangun@joongang.co.kr

▶ 중앙일보 / '페이스북' 친구추가

▶ 넌 뉴스를 찾아봐? 난 뉴스가 찾아와!

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

12.22 (일)

[팩플] AI 추론능력 강화하는 빅테크, AI 에이전트 시대 ‘성큼’

무슨 일이야

왜 중요해

더 알면 좋은 것

중앙일보 주요 뉴스