컨텐츠 바로가기

    12.10 (수)

    이슈 IT기업 이모저모

    [이프카카오 25] 카나나 2.0, 사람처럼 생각하고 행동하는 AI로 진화

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털데일리 이나연 기자] 카카오 인공지능(AI) 모델 '카나나(Kanana)'가 이용자 질문에 답하는 도구에서 나아가 사람처럼 보고 듣고 생각하며 행동하는 '에이전트 AI'로 진화한다.

    김병학 카카오 카나나 성과리더는 24일 경기도 용인시 카카오AI캠퍼스에서 열린 '이프 카카오(if kakao 25)' 컨퍼런스에서 "언어 모델의 효율성과 성능을 혁신적으로 개선하고, 이미지와 음성을 자유자재로 다루는 멀티모달 기술을 통합해 AI 기술의 새로운 패러다임을 열겠다"며 이같이 밝혔다.

    김병학 리더는 이제 AI가 단순히 질문하고 답하는 도구를 넘어, 사용자 목적을 수행하는 친구나 동료와 같은 에이전트 AI로 발전하고 있다고 강조했다. 이러한 에이전트 AI는 사용자가 여러 단계를 거쳐야 했던 과정을 단 한 번의 요청으로 해결해 준다.

    사람이 정보를 인식하고 생각하고 행동하는 과정과 유사한 에이전트 AI의 핵심 능력은 ▲음성·이미지 등 다양한 입력을 파악하는 '지각' ▲상황의 맥락과 의도를 파악하는 '추론' ▲원하는 결과물을 생성하거나 작업을 수행하는 '행동'으로 정의된다.

    ◆'카나나 2.0'으로 성능과 효율성 동시 혁신

    김 리더는 "카나나 모델은 고성능 거대언어모델(LLM)을 기반으로 롱 컨텍스트(장문) 처리와 멀티모달 이해, 외부 도구 활용 능력을 강화하고 있다"고 설명했다. 현재 카카오는 기존 카나나-1.5 보다 성능과 효율성, 서비스 편리성을 극대화한 '카나나 2.0'을 개발 중이다.

    이 모델은 추론 시 일부 파라미터만 활성화해 대규모 추론 환경에서 비용 효율적인 구조를 제공하는 MoE(Mixed-of-Expert) 방식을 적용했다. 또 모든 크기의 모델에 키밸류(Key-Value, KV) 캐시를 압축해 효율적으로 처리하는MLA(Multi-Head Latent Attention) 기술을 공통으로 적용했다.

    '카나나-2-30b-a3b' 모델은 이들 구조를 적용해 개발되고 있다. 김 리더는 "자체 벤치마크 결과 기존 모델 대비 추론 처리량이 획기적으로 증가하고, 응답 속도가 압도적으로 빠르다"며 "동시 접속자가 많은 환경에서도 추론 효율을 크게 높일 수 있을 것"이라고 말했다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    ◆듣고 보고 말하는 '카나나 오'

    카나나는 궁극적으로 어떤 형태의 입력이든 자유자재로 이해하고 생성하는 '애니 투 애니(Any-to-Any)' 구조의 옴니 모델을 지향한다. 그 중심에는 국내 최초로 텍스트, 음성, 이미지를 동시에 이해하고 답하는 통합 멀티모달 언어 모델 '카나나 오(Kanana O)'가 있다.

    카나나 오는 제주 사투리와 같은 지역 방언과 한국 문화, 장소에 대한 이해까지 정확히 인식하며 사용자와의 대화 맥락을 파악해 감정이 담긴 자연스러운 음성 인터페이스를 제공한다. 특히 스트리밍 기술을 적용해 거의 지연 없는 실시간 대화가 가능하다.

    카카오는 AI가 말하는 도중에도 사용자가 끼어들 수 있는 '풀 듀플렉스(Full Duplex)' 대화도 지원할 예정이다.

    ◆이미지·영상 생성까지 무한 확장성 노린다

    카나나 기술은 시각 및 음성 생성 영역으로도 확장되고 있다. 카카오는 이미지 생성 모델인 '카나나 콜라주(Kollage)'를 개발해 서비스에 적용했고, 동영상 생성 모델인 '카나나 키네마(Kinema)'로 확장하고 있다.

    키네마는 이미지를 움직이는 수준을 넘어 인물 포즈를 정교하게 제어하고 자연스러운 영상 생성을 목표로 한다. 연내에는 한국어와 영어 외에도 일본어, 중국어, 베트남어까지 음성 지원을 확장할 계획이다.

    김 리더는 "카나나 모델을 바탕으로 사용자의 마음을 먼저 읽고 알아서 도와주는 에이전트 AI를 현실로 만들겠다"며 "이 비전은 국내 AI 생태계와 함께할 때 완성될 수 있다"고 강조했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.