KT '믿:음 K', 글로벌 AI 성능 지표서 韓 중소형 모델 1위 달성

머니투데이 원문
윤지혜기자
입력

2026.01.05 09:29

주소복사가 완료되었습니다

AAII(Artificial Analysis Intelligence Index)'에 등재된 믿:음 K/사진=KT

<이미지를 클릭하시면 크게 보실 수 있습니다>

KT는 자체 개발한 AI 모델 '믿:음 K'(이하 믿음K)가 글로벌 AI 모델 성능을 종합 평가하는 플랫폼 'AAII'(Artificial Analysis Intelligence Index)에서 국내 중소형 모델 중 1위를 달성했다고 5일 밝혔다. KT는 기업 고객이 손쉽게 도입할 수 있는 '작지만 강한' AI 모델로 국내 B2B(기업간거래) 시장 공략에 박차를 가할 방침이다.

AAII는 AI 평가 전문 기관 아티피셜 애널리시스(Artificial Analysis)가 운영하는 글로벌 평가 플랫폼이다. 다수의 공개 벤치마크 결과를 종합해 세계 주요 AI 모델의 성능을 알려준다. 믿음K는 추론, 전문 지식, 수학·프로그래밍, 에이전트 수행 능력 등 10여개 핵심 평가 항목에서 우수한 점수를 기록해 '범용적으로 똑똑한 AI'임을 인정받았다.

KT 관계자는 "믿음K가 사용자의 질문에 응답하는 데 그치지 않고 목표를 이해한 뒤 필요한 시스템이나 도구를 스스로 활용해 과업을 완수하는 에이전틱 AI로서 글로벌 경쟁력을 갖췄음을 객관적으로 입증했다"고 설명했다.

━
'에이전틱 AI' 특화 성능 평가서 '제미나이'와 나란히
━
KT의 믿음K는 주요 에이전트 성능 벤치마크 중 하나인 'τ²-bench'(타우 스퀘어 벤치)에서 87%를 기록하며 에이전틱 AI 분야 최정상 모델로 이름을 올렸다. 이는 AI가 실제 업무 환경에서 사람과 협업하며 여러 도구를 활용해 과업을 끝까지 수행할 수 있는지를 평가하는 에이전트 특화 벤치마크다. 믿음K는 구글의 최신 모델인 제미나이3와도 어깨를 나란히 했다.

믿음K는 전문 지식과 고난도 추론 능력을 평가하는 MMLU Pro, GPQA, HLE 등 주요 벤치마크에서도 우수한 성적을 거뒀다. 한국어 이해 성능 지표에선 국내 최고 수준을 달성했다. 믿음K는 매개변수 40B이하급 모델로, 대규모 GPU(그래픽처리장치) 인프라 부담을 줄여 효율성을 높이면서도 사용자의 복잡한 지시를 정확히 이해하고, 한국 고유의 문맥과 사회적 맥락을 이해한다는 설명이다.

KT는 모델 아키텍처 설계부터 학습 데이터의 구축까지 전 과정을 직접 수행하는 '프롬 스크래치'(From scratch) 방식으로 믿음K를 개발했다. 초기 개발단계부터 B2B 시장을 정조준했다. KT는 믿음K로 금융·공공·제조 등 산업별로 맞춤형 AI 에이전트를 제공해 기업 고객의 AI 전환(AX)을 선도한다는 목표다.

오승필 KT 기술혁신부문장(부사장)은 "AAII 등재는 KT의 자체 AI 기술력이 글로벌 기준에 도달했음을 객관적으로 입증한 성과"라며 "에이전틱 AI를 통해 한국 기업들의 업무 혁신과 디지털 전환을 이끄는 최고의 AI 파트너가 되겠다"고 말했다.

윤지혜 기자 yoonjie@mt.co.kr

Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

02.25 (수)

KT '믿:음 K', 글로벌 AI 성능 지표서 韓 중소형 모델 1위 달성

머니투데이 주요 뉴스