컨텐츠 바로가기

03.19 (수)

'가성비' 딥시크 vs '전문성' 챗GPT 뭘 고를까[사이언스 PICK]

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

학계에서도 유료 AI 모델급 성능 내는 딥시크 R1 관심 커져

수학·과학 문제 해결 능력 오픈AI o1 모델에 준하는 수준

오픈AI는 전문가 역량 가진 '딥 리서치' 선보이며 차별화

뉴시스

[베이징=AP/뉴시스]28일 중국 수도 베이징의 한 사용자 휴대전화 화면에 딥시크(DeepSeek)와 챗GPT(ChatGPT)의 애플리케이션이 보이고 있다. 2025.01.28.

<이미지를 클릭하시면 크게 보실 수 있습니다>


[서울=뉴시스]윤현성 기자 = 중국의 AI(인공지능) 모델 '딥시크-R1'가 공개된 이후 과학계에서도 AI 모델에 대한 관심이 다시 한 번 끓어오르고 있다. 오픈소스로 사실상 무료 제공된 딥시크의 과학·수학 과제 해결 능력이 오픈AI의 유료 구독 모델인 'o1'에 준한다는 결과가 나오면서다.

이른바 딥시크 쇼크 이후 오픈AI는 전문 연구자 수준의 능력을 갖춘 '딥 리서치'를 챗GPT에 탑재한다고 밝혔다. 딥시크가 개방성, 무료 서비스를 무기로 내세운 만큼 유료지만 더 뛰어난 성능으로 맞서는 것으로 풀이된다. 학계에서도 이들 AI 모델의 효용성을 두고 과학자들의 관심이 고조되고 있다.

8일 국제학술지 네이처에 따르면 학계에서는 딥시크-R1의 수학·과학 문제 해결 능력이 오픈AI의 o1 모델에 준하는 수준이라는 평가가 나오고 있다.

딥시크 고급 추론 모델인 R1도 무료로 제공하고 있다. 반면 오픈AI의 o1은 월 20달러의 유료 정액제인 '챗GPT 플러스' 이상 가입자에게만 한정적으로 제공된다.

물론 R1은 여전히 연구자들이 만족할만한 수준의 전문적인 학술 작업에서는 부족한 점이 많은 상태다. 하지만 네이처는 딥시크가 전 세계 과학자들에게 각자 분야에서 문제를 해결할 수 있게 설계된 '맞춤형 AI 추론 모델'을 자유롭게 훈련시킬 수 있는 기회를 제공하고 있다고 강조했다.

R1 모델의 저렴함과 개방성이 과학 분야에서도 게임체인저가 될 수 있다는 분석이다. R1의 API(앱 프로그래밍 인터페이스)를 사용하면 다른 AI 모델보다 낮은 비용으로 모델을 쿼리하거나, 자체 서버에 AI 모델을 구축·실행할 수 있기 때문이다.

미국 오하이오 주립대학교 연구진이 생물학·컴퓨터 화학·신경과학 등을 다룬 실제 논문에서 가져온 데이터 기반 과학 과제에 대한 R1 능력을 예비 테스트한 결과 R1과 o1의 성능은 큰 차이를 보이지 않았다.

연구진은 R1과 o1에게 20개의 과학 과제를 풀도록 했는데, 두 모델 모두 약 3분의 1의 과제만 올바르게 해결했다. API를 사용해 R1을 실행하는 비용은 o1 대비 약 13배 적었으나, R1이 과제를 보고 '생각'하는 시간은 o1보다 더 느렸던 것으로 파악됐다.

R1은 수학 분야에서도 가능성을 보이고 있다. 영국 옥스퍼드대학교 연구진은 함수 분석 분야에서 두 모델의 테스트를 진행했다. 테스트 결과 R1의 논증이 o1보다 더 유망한 결과를 도출한 것으로 분석됐다.

이처럼 경쟁사의 무료 AI 모델이 만만치 않은 성능을 선보이면서 오픈AI는 이달 초 연구자 수준의 역량을 가진 새 AI 에이전트 딥 리서치를 챗GPT에 탑재했다.

딥 리서치가 탑재된 챗GPT는 수백 개의 온라인 소스를 분석·종합해 전문가 수준의 보고서를 작성해낸다. 작성 과정에서 활용한 참고 문헌 등도 별도로 표시된다.

딥 리서치는 오픈AI의 추론형 모델인 o3의 능력과 인터넷 검색 기능을 결합하는 식으로 만들어졌다. 과학 뿐만 아니라 금융·정책·엔지니어링 등 전문 영역을 위해 개발했다는 게 오픈AI의 설명이다. 당초 사람이 직접 한다면 수시간 이상 걸리는 작업을 몇십분 만에 처리해낼 수도 있다.

오픈AI는 딥 리서치가 AI 성능 평가 중 하나인 '인류의 마지막 시험(Humanity’s last exam)'에서 25.3%의 정답률을 기록했다고 강조했다. 이 평가는 현재 가장 점수를 따기 힘든 AI 성능 평가로 알려져 있다. o1'과 o3 미니가 각각 9.1%와 13.0%, 딥시크 R1이 9.4%를 기록한 것을 고려하면 새 에이전트의 성능이 확실하게 차별화된 셈이다.

네이처에 따르면 의학 연구를 위해 오픈AI로부터 챗GPT 프로 무료 이용권을 제공받고 있는 미국 파밍턴에 있는 잭슨 연구소 소속 면역학자 데리아 우누트마즈는 "오픈AI의 심층 연구 보고서가 신뢰할 수 있고 이미 출판된 리뷰 논문만큼이나 훌륭한 수준이다. 연구 리뷰 작성이 쓸모없어진다고 생각될 정도"라고 밝히기도 했다.

다만 오픈소스 형태로 개방된 딥시크 R1과 달리 딥 리서치는 월 200달러의 유료 모델 '챗GPT 프로'에만 우선 제공된다. 오픈AI가 향후 더 저렴한 플러스(월 20달러)와 팀(월 25달러), 엔터프라이즈)(기업용) 구독자에게도 순차 지원할 계획이라고 밝히긴 했으나 명확한 시점은 아직 정해지지 않았다.

딥시크의 무료·개방성에 맞서 오픈AI는 유료·전문성을 차별점으로 내세우는 것으로 보인다. 과학계에서도 AI의 효용성을 인정하는 모습이 나타나고 있는 만큼 이들 AI 모델의 경쟁 영역이 더 넓어질 것으로 전망된다.

☞공감언론 뉴시스 hsyhs@newsis.com

▶ 네이버에서 뉴시스 구독하기
▶ K-Artprice, 유명 미술작품 가격 공개

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.