맷 가먼 AWS 최고경영자(CEO)가 2일(현지시간) 미국 라스베이거스에서 열린 '리인벤트 2025'에서 기조연설을 하고 있다. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
"인공지능(AI) 에이전트가 사람의 업무 효율을 10배 이상 확장하기 시작했습니다."
맷 가먼 아마존웹서비스(AWS) 최고경영자(CEO)는 2일(현지시간) 미국 라스베이거스에서 열린 연례 콘퍼런스 '리인벤트(re:Invent) 2025'에서 "AI 에이전트가 AI 발전의 궤도에서 중요한 변곡점에 도달했다"며 이같이 강조했다.
AWS는 AI 에이전트 시대를 겨냥해 인프라스트럭처부터 모델, 애플리케이션 계층까지 아우르는 '풀스택' 신제품을 공개하며, AI 에이전트의 개발·운영 전 과정을 혁신하겠다는 구상을 밝혔다.
첫 번째 축은 기반을 담당하는 인프라다. AWS는 엔비디아 그래픽처리장치(GPU)를 위협할 새로운 자체 칩 '트레이니엄3'를 공개했다. 이전 세대 제품 대비 최대 4.4배 향상된 컴퓨팅 성능과 4배 많은 메모리 대역폭을 제공하는 것이 특징이다. 성능 향상뿐 아니라 이전 세대 대비 40% 오른 에너지 효율성을 제공한다.
구글의 텐서처리장치(TPU)가 엔비디아 GPU의 아성을 위협하는 가운데, AWS도 전력 효율성을 극대화한 자체 AI 칩을 내놓으며 엔비디아와 경쟁에 나선 것이다. 가먼 CEO는 "트레이니엄3는 대규모 AI 훈련과 추론에 업계 최고 수준의 '가격 대비 성능'을 제공한다"며 "경쟁 칩 대비 최대 50% 비용을 절감할 수 있을 것"이라고 강조했다.
내년 출시를 목표로 '트레이니엄4' 개발에도 착수했다. 트레이니엄4의 가장 큰 특징은 엔비디아의 초고속 데이터 연결 기술인 'NV 링크 퓨전'을 지원하도록 설계된다는 점이다. 자체 칩의 성능을 키우는 동시에 엔비디아 생태계 수요까지 흡수하겠다는 전략으로 풀이된다.
AWS는 산업·공공 분야를 위한 고성능 AI 인프라 전환 서비스 'AWS AI 팩토리'도 발표했다. 이 서비스는 기업과 정부 기관 등이 자체 데이터센터에 전용 AWS AI 인프라를 구축할 수 있도록 지원하며, 최신 엔비디아 가속 컴퓨팅 플랫폼과 트레이니엄 칩, 고속·저지연 네트워킹, AWS AI 서비스 등을 활용하도록 설계됐다.
가먼 CEO는 "AI 팩토리는 각 고객 전용으로 운영되고 분리된 환경을 유지할 수 있다"며 "AWS가 제공하는 보안성과 신뢰성을 유지하면서도 엄격한 규정 및 소프트웨어 요구 사항을 충족하는 데 도움이 될 것"이라고 말했다. AWS는 이미 사우디아라비아의 휴메인과 전략적 파트너십을 체결하고 AI 팩토리를 구축 중이다.
AWS는 지난해 처음 공개한 자체 개발 AI 모델 '노바'의 새 버전인 '노바2'도 공개했다. 노바2는 비용 효율성을 강조한 '라이트(Light)', 최고 성능 모델인 '프로(Pro)', 대화형 음성 AI 모델 '소닉(Sonic)', 텍스트·이미지·비디오·음성을 동시에 처리하는 멀티모달 모델 '옴니(Omni)'까지 총 4종으로 구성된다. 가먼 CEO는 "특히 노바2 프로는 에이전트 능력에서 탁월한 성능을 발휘한다"며 "에이전트 기능의 핵심인 지시사항 수행과 에이전틱 도구 활용 능력에서 GPT5.1와 제미나이3보다 우위에 있다"고 강조했다.
모델 업그레이드와 더불어 맞춤형 프런티어 모델 구축을 돕는 서비스 '노바 포지'도 눈에 띈다. 이는 모델을 처음 만들 때부터 기업 특화 데이터를 반영할 수 있도록 한 서비스다. 가먼 CEO는 "노바 포지는 모델의 핵심 기초 능력을 손상시키지 않으면서도 특화 지식을 도입할 수 있다"고 설명했다. 한편 AWS는 고객이 AI 에이전트를 잘 만들 수 있도록 지원하는 인프라와 베드록, 노바 생태계 외에 새로운 AI 에이전트 자체도 선보였다.
[라스베이거스 안선제 기자]
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
