컨텐츠 바로가기

09.29 (일)

[단독] 아마존웹서비스도 '멀티모달 AI' 참전 이미지·음성 … 인식의 지평 넓어진다

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
세계 최대 클라우드 기업인 아마존웹서비스(AWS)가 생성형 인공지능(AI) 기반의 '멀티모달 거대언어모델(LLM)' 시장에 뛰어든다.

멀티모달 LLM은 자연어 텍스트뿐만 아니라 이미지, 음성, 비디오 등 다양한 형태의 데이터를 인식하고 생성할 수 있는 생성형 AI 모델을 의미한다. 그동안 생성형 AI 시장에서 경쟁사인 구글, 마이크로소프트(MS)에 비해 상대적으로 뒤처졌다는 평가를 받아온 AWS가 멀티모달 LLM으로 격차를 줄일 수 있을지 주목된다.

28일(현지시간) 정보기술(IT) 업계에 따르면, AWS는 자체 개발 LLM '타이탄'의 멀티모달 버전을 29일 공식 발표한다. 해당 내용은 미국 라스베이거스에서 진행 중인 연례 콘퍼런스 'AWS 리인벤트(re:Invent) 2023'에서 스와미 시바수브라마니안 데이터·AI 부사장의 기조연설을 통해 공개될 예정이다. 이와 함께 AWS는 타이탄을 바탕으로 최근 새롭게 개발한 AI 이미지 합성(디퓨전) 모델인 '타이탄 이미지 제너레이터'도 발표할 계획이다.

AWS가 지난 4월 타이탄을 공개한 지 약 7개월 만에 타이탄의 멀티모달 버전을 발표하게 된 것은 최근 멀티모달 LLM이 글로벌 AI 시장의 새로운 게임체인저로 주목받고 있기 때문이다. 데이터 형식에 구애받지 않는 멀티모달 AI 모델은 인간의 지능에 가까운 차세대 범용 AI인 인공일반지능(AGI) 구현에도 핵심적이다. 오픈AI는 이미 '챗GPT'를 멀티모달 모델로 서비스하고 있고, 구글 역시 이미지 입력 기능을 갖춘 LLM '팜(PaLM) 2'에 이어 후속 멀티모달 모델인 '제미니'를 개발 중이다.

AWS는 이번 리인벤트를 통해 생성형 AI 관련 신규 서비스를 잇달아 발표하면서 강력한 드라이브를 걸고 있다. 여전히 AWS가 글로벌 클라우드 시장에서 가장 높은 점유율을 기록하고 있지만, 최근 몇 년간 경쟁사에 시장을 내주면서 내부적으로 위기의식이 크게 작용했을 것이란 분석도 나온다.

28일에는 애덤 셀립스키 AWS 최고경영자(CEO)가 자연어 텍스트를 통한 의사소통으로 문서 요약과 자료 생성, 코드 작성 등 업무를 도와 주는 기업용 생성형 AI 챗봇 '아마존 Q'를 전격 공개했다. 현재 아마존 Q는 고객센터 관리 플랫폼 '아마존 커넥트'에 정식 출시됐고, 향후 '아마존 퀵사이트' 'AWS 서플라이 체인' 등 기업용 솔루션에도 도입된다.

일반 대중용 AI 챗봇을 먼저 내놨던 구글·MS와 달리 처음부터 기업용 AI에 집중한 AWS는 차별화된 보안성을 내세웠다.

셀립스키 CEO는 "아마존 Q는 사용자의 신원과 권한을 정확하게 파악하고 그에 따른 개인 맞춤형 서비스를 제공한다"며 "비즈니스 고객의 콘텐츠를 절대로 학습 등에 활용하지 않는다"고 강조했다. 아마존 Q는 요금도 1인당 월 20~25달러로 구글·MS보다 저렴하게 책정됐다.

한편 이날 셀립스키 CEO 연설 도중 엔비디아의 설립자 젠슨 황 CEO가 깜짝 등장했다. 엔비디아는 "내년 초 출시 예정인 세계 최고 속도의 그래픽처리장치(GPU) 'GH200'의 첫 클라우드 고객사로 AWS를 선정했다"고 밝혔다. 이를 토대로 AWS는 AI 슈퍼컴퓨팅 자원을 고객에게 제공한다.

[라스베이거스 송경은 기자]

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.