컨텐츠 바로가기

10.26 (토)

딥마인드, '시스템 2 사고' 강화한 AI 에이전트 프레임워크 '토커-리즈너' 공개

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]
AI타임스

(사진=셔터스톡)

<이미지를 클릭하시면 크게 보실 수 있습니다>


구글 딥마인드가 인공지능(AI) 에이전트 기능 향상을 위해 추론 능력을 강화하는 '시스템 2 사고(System 2 thinking)'라는 개념을 도입했다. 이는 즉각적인 대응을 담당하는 부분과 복잡한 추론 기능을 맡는 부분으로 에이전트를 나누는 것으로, 이를 통해 효울적으로 복잡한 업무를 처리하는 프레임워크를 제시했다.

구글 딥마인드 연구진은 24일(현지시간) AI 에이전트에 다단계 계획과 복잡한 추론, 전략적 의사 결정 기능 등을 통합한 '토커-리즈너(Talker-Reasoner)' 프레임워크 논문을 아카이브에 게재했다고 보도했다.

특히 연구진은 기존 에이전트와 달리, '시스템 2 사고'를 도입했다고 강조했다. 노암 브라운 오픈AI 연구원도 지난 22일 TED 컨퍼런스에서 'o1' 모델의 추론 능력을 강조하기 위해 이 용어를 들고 나왔다.

이는 노벨상 수상자인 다니엘 카너먼의 저서 '빠르고 느리게 생각하기(Thinking, Fast and Slow)'에서 처음 소개된 용어다. 그는 인간의 두뇌가 자동적이고 처리가 빠른 '시스템 1'과 의식적이고 처리가 느린 '시스템 2' 두가지 모드로 사고를 처리한다고 설명했다.

시스템 1은 빠르고 직관적이며 자동으로 작동한다. 이는 갑작스러운 사건에 대한 반응이나 익숙한 패턴을 인식하는 등 즉각적인 판단을 관장한다.

반면 시스템 2는 느리고 신중하며 분석적이다. 이 시스템은 복잡한 문제 해결, 계획 수립, 그리고 추론을 가능하게 한다.

두 시스템은 끊임없이 상호작용한다. 시스템 1은 시스템 2를 위한 인상, 직관, 의도를 지속적으로 생성한다. 시스템 2가 이를 승인하면, 인상과 직관은 시스템 2의 명시적인 신념의 기초를 형성하고, 의도는 시스템 2의 의도적인 선택으로 발전하게 된다. 이 상호작용 덕분에 인간은 일상적인 루틴부터 복잡한 문제까지 다양한 상황을 원활하게 헤쳐나갈 수 있다.

현재 대부분의 AI 에이전트는 시스템 1 모드에서 주로 작동한다. 이들은 패턴 인식, 빠른 반응, 반복적인 작업에 뛰어나다. 그러나 여러 단계에 걸친 계획 수립, 복잡한 추론, 전략적 의사 결정이 필요한 상황에서는 부족함을 드러내곤 한다. 이는 시스템 2 사고의 핵심 요소다.

AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


딥마인드가 제안한 토커-리즈너 프레임워크는 AI 에이전트에 시스템 1(토커)과 시스템 2(리즈너) 기능을 모두 갖추도록 하는 것을 목표로 한다.

토커는 시스템 1에 해당하는 빠르고 직관적인 구성 요소이다. 사용자 및 환경과의 실시간 상호작용을 처리한다. 관찰을 인지하고, 언어를 해석하며, 기억에서 정보를 검색하고, 대화 응답을 생성한다. 토커 에이전트는 이러한 기능을 수행하기 위해 대형언어모델(LLM)의 상황 내 학습(in-context learning) 능력을 주로 사용한다.

리즈너는 시스템 2의 느리고 신중한 특성을 구현, 복잡한 추론 및 계획을 수행한다. 도구나 외부 데이터 소스와 상호작용해 지식을 증강하고 정보에 기반한 결정을 내린다. 또 새로운 정보를 추가해 에이전트의 지식을 업데이트한다. 이는 추후 판단의 기준으로, 토커가 대화할 때 '기억'으로 작용한다.

결국 토커 에이전트는 사용자와 자연스럽고 일관된 대화를 생성하고 환경과 상호작용하는 데 중점을 두는 반면, 리즈너 에이전트는 다단계 계획 수립, 추론, 그리고 토커가 제공한 환경 정보를 바탕으로 지식을 업데이트하는 데 집중한다,

두 모듈은 공유 메모리 시스템을 통해 상호작용한다. 리즈너는 최신 신념과 추론 결과로 메모리를 업데이트하고, 토커는 이 정보를 검색하여 사용자와 대화한다. 이런 비동기식 통신 방식 덕분에 토커는 리즈너가 백그라운드에서 더 많은 시간이 소요되는 계산을 수행하는 동안에도 지속적인 대화 흐름을 유지할 수 있다.

토커는 항상 활성화되어 환경과 상호작용하고, 리즈너는 토커가 기다릴 때만 지식을 업데이트해 토커에 정보를 제공하거나 메모리에서 이를 읽을 수 있게 만든다.

AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


예를 들어, 수면 코칭 애플리케이션에서 수면 코치의 토커는 대화적 측면을 처리, 사용자에게 공감 어린 응답을 제공하고 코칭 과정의 다양한 단계로 안내한다. 리즈너는 사용자의 수면 문제와 목표, 습관 및 환경에 대한 지식 상태를 유지한다. 이를 통해 개인화된 생활 방식을 추천하고 계획을 생성해 낸다.

딥마인드는 향후 연구를 위한 방향도 제시했다.

그중 하나는 토커와 리즈너 간의 상호작용 최적화다. 이상적으로 토커는 리즈너의 개입이 필요한 쿼리와 혼자서도 처리할 수 있는 쿼리를 자동으로 판단해야 한다. 이를 통해 불필요한 계산을 최소화하고 전체적인 효율성을 향상할 수 있다.

다른 하나는 이 프레임워크를 확장, 다양한 추론 유형이나 지식 분야에 특화된 여러 리즈너를 통합하는 것이다. 이를 통해 에이전트는 더 복잡한 작업을 수행하고 포괄적인 지원을 제공할 수 있게 된다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.