컨텐츠 바로가기

    02.25 (수)

    이슈 IT기업 이모저모

    카카오, '카나나-2' 모델 추가 공개…"오픈소스, 범용 GPU도 OK"

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털데일리 채성오기자] 카카오가 자체 기술력을 기반으로 개발한 차세대 언어모델 '카나나-2'를 업데이트하고 관련 모델 4종을 오픈소스로 추가 공개했다고 20일 밝혔다.

    카나나-2는 지난해 12월 허깅페이스를 통해 오픈소스로 공개한 언어모델이다. 에이전틱 AI 구현에 최적화된 고성능·고효율 기술 경쟁력을 입증한 카카오는 불과 한 달 여 만에 성능을 크게 업데이트한 4종의 모델을 오픈소스로 추가 공개했다.

    이번에 공개한 4종의 모델은 고효율과 저비용의 성능 혁신은 물론 실질적인 에이전틱 AI 구현을 위한 도구 호출 능력을 대폭 강화한 것이 특징이라고 카카오 측은 설명했다. 특히 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 GPU(그래픽처리장치)에서도 원활하게 구동되도록 최적화해 실용성을 높였다.

    카나나-2 효율성의 핵심은 '전문가 혼합(MoE)' 아키텍처다. 전체 파라미터는 32B(320억개) 규모로 거대 모델의 높은 지능을 유지하면서도 실제 추론 시에는 상황에 맞는 3B(30억개) 파라미터만 활성화해 연산 효율을 높였다. 또한 MoE 모델의 학습에 필수적인 여러 커널을 직접 개발해 성능 손실 없이 학습 속도는 높이고 메모리 사용량은 획기적으로 낮췄다고 카카오 측은 설명했다.

    아키텍처 및 데이터의 고도화 뿐 아니라 데이터 학습 단계도 고도화한 것으로 알려졌다. 사전 학습과 사후 학습 사이 '미드 트레이닝' 단계를 신설하고 AI 모델이 새로운 정보를 배울 때 기존 지식을 잊는 치명적 망각 현상을 방지하기 위해 '리플레이' 기법도 도입했다. 이를 통해 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 안정적으로 유지할 수 있다.

    카카오는 이런 기술을 바탕으로 기본(Base) 모델·지시 이행(Instruct) 모델·추론 특화(Thinking) 모델·미드 트레이닝(Mid-training) 모델까지 총 4종의 모델을 허깅페이스에 추가 공개했다. 연구 목적으로 활용도가 높은 미드 트레이닝 탐색용 기본 모델을 함께 제공해 오픈소스 생태계 기여도를 높였다.

    김병학 카카오 카나나 성과리더는 "새로워진 카나나-2는 어떻게 하면 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있을까에 대해 치열하게 고민한 결과"라며 "보편적인 인프라 환경에서도 고효율을 내는 모델을 오픈소스로 공개함으로써 국내 AI 연구 개발 생태계 발전과 기업들의 AI 도입의 새로운 대안이 될 수 있기를 기대한다"고 말했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.