컨텐츠 바로가기

[황보현우의 AI시대] 〈28〉딥리서치와 연구 AI

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
전자신문

황보현우 서울대학교 산업공학과 객원교수


오픈AI는 지난 2월 2일 전문 분야 연구와 시장조사를 지원하는 챗GPT 딥리서치(Deep Research)를 출시했다. 인공지능(AI)을 통해 심층 조사와 체계적 분석을 기반으로 한 학술논문과 보고서 작성이 가능해진 것이다.

경쟁사인 구글도 딥리서치 기능을 추가한 제미나이 2.0 플래시 싱킹(Gemini 2.0 Flash Thinking)과 연구 지원 AI 에이전트인 공동과학자(co-scientist)를 발표했다. 퍼플렉시티(Perplexity)는 딥리서치 기능을 일반 사용자에게 공개했으며, 일론 머스크의 xAI 역시 그록(Grok-3)에 딥서치(Deep Search) 를 추가해 연구 AI 시장에 뛰어들었다. 이외에 펠로(Felo), 젠스파크(Genspark), 라이너(Liner) 등도 연구 AI 시장에 본격적으로 진출했다.

연구 AI 분야에서 빅테크와 스타트업을 망라한 AI 기업간 경쟁이 본격화된 것이다. 이에 따라 오픈AI는 월 200달러를 내는 챗GPT 프로 구독자에게만 공개했던 딥리서치 기능을 2월 22일부터 월 20달러를 내는 챗GPT 플러스 고객에게도 제공하기 시작했다. 구글 역시 3월 14일부터 제미나이 유료(advanced) 이용자만 접근 가능했던 딥리서치 기능을 일반 사용자에게 무료로 공개하고 있다.

챗GPT 딥리서치는 오픈AI의 주축 모델인 챗GPT 4o와 비교했을 때 산출물의 수준 차이가 확연하기 때문에 출시 당시부터 연구자의 반응이 뜨거웠다. 지금까지 개발된 AI 벤치마크 사상 가장 난이도가 높은 '인류의 마지막 시험'(Humanity's Last Exam:HLE)에서 챗GPT 딥리서치는 26.6%의 정답률을 기록해 딥시크(DeepSeek-R1)의 9.4%를 무려 2.8배 앞섰다.

생산성이 우수한 연구 AI의 등장에 따라 막대한 인적, 물적 자원의 투입과 절대적 시간 소요가 당연시되었던 작업을 이제 AI에게 맡길 수 있게 되었다. 사람이 수개월에서 수년에 걸쳐 수행했던 일을 AI는 몇시간 또는 며칠만에 해낼 수 있고, 결과물 역시 박사과정 연구원 수준으로 뛰어나기 때문이다.

딥리서치는 기존 생성형 AI와 달리 출처와 추론과정을 공개하기 때문에 환각 현상을 최소화할 수 있다는 점이 큰 매력 요인이다. 논문, 보고서, 뉴스 등 신뢰할 수 있는 데이터를 교차 검증하기 때문에 결과물의 신뢰도가 높다는 장점도 있다. 딥리서치의 탁월한 성능은 다수의 추론 AI가 강점으로 내세웠던 다단계 검색과 생각의 사슬(Chain of Thought:CoT) 기법에 힘입은 바 크다.

여러 전문가들은 챗GPT 딥리서치를 비롯한 연구 AI의 성능이 박사과정 재학생 또는 실무경력 3~5년차 수준이라는 평가를 내놓고 있다. 월 20~200달러에 박사급 연구원을 조수로 쓸 수 있게 된 것이다. 비용 효율성을 따지자면 이제 인간이 연구 AI의 속도와 비용을 따라갈 수 없게 되었다.

학술 분야에서도 연구 AI의 파급력은 상당하다. 캐나다 토론토대 케빈 브라이언 교수는 'B급 저널이라면 AI로 하루만에 작성한 논문을 게재할 수 있을 수준'이라고 평가했다. 연구자 커뮤니티에서는 딥리서치를 활용해 작성한 논문이 학술지 게재 승인을 받았다는 사례들이 속속 보고되고 있다.

연구 AI 덕분에 연구자들은 보다 창의적이고, 생산적인 업무에 시간과 노력을 투자할 수 있게 되었다. 과거 연구자로서 힘들게 쌓아왔던 실적이 이제 AI를 잘 쓰기만 하면 단시간 내에 만들 수 산출물로 변모했기에 과거의 노력이 초라해지는 씁쓸함과 안타까움은 별개의 문제이다.

딥리서치는 다수의 전문가로부터 인간의 일자리를 대체할 수 있는 첫번째 AI라는 평가를 받고 있다. 그렇다면 우리는 어떻게 대응해야 할까?

우리는 모라벡의 역설(Moravec's Paradox)로부터 해답을 찾을 수 있다. 모라벡의 역설은 'AI가 인간에게 어려운 문제는 잘 해결할 수 있지만, 정작 쉬운 문제는 잘 풀지 못한다'는 점을 지적한다. 이는 인간이 학습 데이터가 부족하더라도 문제를 해결할 수 있는 '직관'을 보유하고 있기에 가능한 일이다. AI가 발전할수록 인간이 잘하는 영역과 AI가 잘 작동하는 분야가 명확해지고 있다.

현재의 AI는 아직 권위 있는 정보와 소문을 구별하지 못하는 한계를 가지고 있다. 더불어 중요한 의사결정을 내리는 것과 AI를 통제하는 일은 인간이 직접 관여해야 한다. 인류의 생존을 가름할 위험한 사항을 AI에게 맡길 수는 없기 때문이다.

우리는 AI라는 거대한 시대적 흐름을 거스를 수 없다. 19세기 인간을 대체하는 기계를 거부했던 러다이트 운동(Luddite Movement)의 어리석음을 반복해서는 안 된다. 우리는 인간이 더 잘 할 수 있는 영역에 집중하고, AI의 효율적 활용에 보다 많은 노력을 기울여야 한다.

황보현우 서울대학교 산업공학과 객원교수

[Copyright © 전자신문. 무단전재-재배포금지]


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

전자신문 주요 뉴스

해당 언론사로 연결됩니다.