카시마 턴피피차이(Kasima Tharnpipitchai) SCB 10X 타이푼 AI전략 총괄은 타이푼을 통해 태국의 AI 접근성을 높이고 기업 리서치 역량을 높이는 게 목표라고 강조했다. [사진: 디지털투데이] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[라스베이거스(미국)=디지털투데이 이진호 기자] 세계적으로 통용되지 않는 언어를 위한 AI 개발은 여전히 빈 공간으로 남아 있다. 글로벌 AI 모델들이 수십개 언어를 지원한다지만 실제 서비스 품질에서 태국어는 종종 후순위로 밀린다. 태국의 '타이푼(Typhoon)'은 바로 이점에 착안했다. 태국어와 태국 문화를 녹인 AI로 격차를 줄인다는 포부다.
미국 라스베이거스에서 열린 아마존웹서비스(AWS)의 연례 컨퍼런스 '리인벤트(re:Invent) 2025'에서 만난 카시마 턴피피차이(Kasima Tharnpipitchai) SCB 10X 타이푼 AI전략 총괄은 "AI 접근성을 높이고 기업 리서치 역량을 높이는 게 목표"라며 "태국어를 잘 이해하는 AI로 지식 분야의 힘을 키울 것"이라고 말했다.
타이푼은 태국 SCB 10X 그룹 산하의 연구개발 프로젝트다. 태국어와 태국 문화에 최적화한 동명의 거대언어모델(LLM)을 만든다. 시암 커머셜 뱅크(SCB)의 금융 업무를 AI로 지원하고, 나아가서는 태국 전체의 AI 활용도를 높이는 게 목표다.
턴피피차이 총괄은 "태국 사람들이 AI 시대에 뒤처질 것 같은 공포감이 있었다"며 "타이푼을 통해 태국인들이 AI에 더 가까워졌으면 한다"고 말했다.
금융업에는 여신, 보험, 대출, 투자 등 수많은 업무가 있다. 모두 정확한 정보 수집이 필수인 분야다. 하지만 태국어로 검색했을 때 적확한 정보를 얻지 못하거나 현지 상황을 반영하지 못할 수 있다. 이 같은 문제를 해결하는 데 타이푼이 도움이 될 거라는 게 턴피피차이 총괄의 말이다
투자 업무라고 치면 이와 관련한 정보를 투자자에게 제공해야 한다. 이에 태국어와 태국 문화 기반 정보를 수집·분석해 투자자에게 제공하는 AI를 만드는 식이다. 또 태국 정부 규제를 태국어로 정확히 파악하고 규제 준수 여부도 체크할 수 있다.
타이푼이라는 이름은 태국을 뜻하는 타이(Thai)와 발음을 맞췄다. 타이푼은 모델 개발에 다양한 오픈소스를 쓰는데 그 중 하나가 프랑스의 미스트랄(Mistral)이다. 미스트랄은 프랑스 남부에서 부는 돌풍 이름이다. 회사의 뿌리인 태국, 활용하는 파운데이션 모델, 그리고 AI 생태계에 바람을 불러오겠다는 포부가 두루 녹아들었다.
태국은 인구 7100만명이 넘는 나라다. 국토 면적은 한국의 5배에 달한다. 같은 태국어라도 억양이나 표기 체계가 다른 곳이 있다. 대표적인 게 북동부 '이산'이다. 2000만명 이상이 이산어를 쓴다. 하지만 발음과 철자가 표준어와 다른 터라 범용 모델로는 이산 사람들의 언어를 제대로 이해할 수 없었다.
타이푼은 이 점에 착안해 이산 지역 특화 모델을 내놨다. 이산어 모델을 만들기 위해 언어학자를 섭외해 체계를 새로 설계하고, 원어민을 모집해 음성을 수집한 후 다시 이를 평가하는 과정을 밟았다. 이 과정에는 콘깬 대학과 같은 지역 대학도 참여했다.
광학문자인식(OCR) 모델도 개발했다. 알파벳을 쓰지 않는 언어 특성상 문자 이해도가 높은 OCR이 필요하다. 글로벌 모델에 비해 성능과 리소스 효율이 좋은 태국어 OCR로 정부 문서나 태국 특유의 서식을 이해할 수 있다.
한국은 AI 모델 개발을 위한 '데이터 싸움'이 한창이다. 양질의 데이터를 활용해 모델을 학습시키고 고도화하는 게 당면 과제다. 태국도 마찬가지다. 타이푼은 빅데이터 인스티튜드 등 정부가 운영하는 정보 저장소를 통해 태국어 데이터를 수집한다. 이를 통해 더 정확한 모델을 구현할 수 있었다.
AWS도 든든한 우군이다. 타이푼은 올해 AWS의 '생성형 AI 엑셀러레이터' 프로그램에 선정됐다. 태국 기업으로는 유일하게 이름을 올렸다. 턴피피차이 총괄은 "세이지메이커와 베드록 등 AWS의 인프라와 서비스를 활용해 더 많은 태국인이 쓰는 서비스로 성장시킬 계획"이라며 "기술 외적으로도 마케팅과 세일즈 등 AWS가 타이푼의 성장에 큰 도움을 주고 있다"고 말했다.
타이푼은 LLM을 통한 태국의 AI 활용도 향상이 궁극적인 목표다. 글로벌 모델이 제공하지 못하는 로컬 언어 기능으로 태국 전반에 AI 활용을 뿌리 내린다. 턴피피차이 총괄은 "타이푼을 통해 태국어 사용자들의 AI 접근성을 높인다면 더할 나위 없을 것"이라고 말했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
