AI칩 ‘트레이니엄 3’ 공개
성능 4배·전력사용 40% 절감
가성비 무기 GPU에 도전장
자체 칩부터 모델·플랫폼까지
에이전트 ‘풀패키지’로 승부
성능 4배·전력사용 40% 절감
가성비 무기 GPU에 도전장
자체 칩부터 모델·플랫폼까지
에이전트 ‘풀패키지’로 승부
맷 가먼 아마존웹서비스(AWS) 최고경영자(CEO)가 2일(현지시간) ‘리인벤트 2025’에서 기조연설을 하고 있다. [AWS] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
“인공지능(AI) 에이전트가 사람의 업무 효율을 10배 이상 확장하기 시작했습니다.”
맷 가먼 아마존웹서비스(AWS) 최고경영자(CEO)는 2일(현지시간) 미국 라스베이거스에서 열린 연례 콘퍼런스 ‘리인벤트(re:Invent) 2025’에서 “AI 에이전트가 AI 발전의 궤도에서 중요한 변곡점에 도달했다”며 이같이 강조했다.
AWS는 AI 에이전트 시대를 겨냥해 인프라스트럭처부터 모델, 애플리케이션 계층까지 아우르는 ‘풀스택’ 신제품 공개하며, AI 에이전트의 개발·운영 전 과정을 혁신하겠다는 구상을 밝혔다.
첫 번째 축은 기반을 담당하는 인프라다. AWS는 엔비디아 그래픽처리장치(GPU)를 위협할 새로운 자체 칩 ‘트레이니움 3’를 공개했다. 이전 세대 제품 대비 최대 4.4배 향상된 컴퓨팅 성능과 4배 많은 메모리 대역폭을 제공하는 게 것 특징이다. 성능뿐 아니라 이전 세대 대비 40% 향상된 에너지 효율성을 제공한다.
구글의 텐서처리장치(TPU)가 엔비디아 그래픽처리장치(GPU)의 아성을 위협하고 있는 가운데, AWS도 전력 효율성을 극대화한 자체 AI 칩을 내놓으며 엔비디아와 경쟁에 나선 것이다. 가먼 CEO는 “트레이니움 3은 대규모 AI 훈련과 추론에 업계 최고 ‘가격 대비 성능’을 제공한다”며 “경쟁 칩 대비 최대 50% 비용을 절감할 수 있을 것”이라고 강조했다.
내년 출시를 목표로 ‘트레이니움 4’도 개발에 착수했다. 가먼 CEO는 “트레이니움 3과 비교해 트레이니움 4는 6배의 컴퓨팅 성능, 4배의 메모리 대역폭을 제공할 것”이라며 기대감을 높였다.
트레이니움 4의 가장 큰 특징은 엔비디아의 초고속 데이터 연결 기술인 ‘NV링크 퓨전’을 지원하도록 설계된다는 점이다. NV링크는 대규모 AI 모델을 학습할 때 연산 장치 간 통신 속도를 극대화하는 기술로, 자체 칩의 성능을 키우는 동시에 엔비디아 생태계 수요까지 흡수하겠다는 전략으로 풀이된다.
AWS는 산업·공공 분야를 위한 고성능 AI 인프라 전환 서비스 ‘AWS AI 팩토리’도 발표했다. 이 서비스는 기업과 정부 기관 등이 자체 데이터센터에 전용 AWS AI 인프라를 구축할 수 있도록 지원하며, 최신 엔비디아 가속 컴퓨팅 플랫폼과 트레이니움 칩, 고속·저지연 네트워킹, AWS AI 서비스 등을 종합적으로 활용하도록 설계됐다.
가먼 CEO는 “AI 팩토리는 각 고객 전용으로 운영되며, 분리된 환경을 유지할 수 있다”며 “AWS가 제공하는 보안성과 신뢰성을 유지하면서도 엄격한 규정 및 소프트웨어 요구 사항을 충족하는 데 도움이 될 것”이라고 말했다. AWS는 이미 사우디아라비아의 휴메인과 전략적 파트너십을 체결하고 AI 팩토리를 구축 중이다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이날 AWS는 이날 자사 AI플랫폼 ‘아마존 베드록’에도 사상 최대 규모 업데이트를 진행했다. 가먼 CEO는 “아마존 베드록이 전례 없는 성장을 보이고 있다”며 “전년 동기 대비 베드록 고객사가 2배 이상 증가했고, 1조 토큰 이상 처리한 고객사가 50곳을 넘었다”고 말했다. AWS는 이러한 흐름을 이어가고자 이날 베드록에 18개의 신규 오픈 웨이트 모델을 추가했으며, 프랑스 AI 기업 ‘미스트랄’의 모델 4종도 처음 포함됐다.
AWS는 지난해 첫 공개한 자체 개발 AI 모델 ‘노바’의 새 버전인 ‘노바 2’도 공개했다. 노바 2는 비용 효율성을 강조한 ‘라이트(Light)’, 최고 성능 모델인 ‘프로(Pro)’, 대화형 음성 AI 모델 ‘소닉(Sonic)’, 텍스트·이미지·비디오·음성을 동시에 처리하는 멀티모달 모델 ‘옴니(Omni)’까지 총 4종으로 구성된다. 가먼 CEO는 “특히 노바2 프로는 에이전트 능력에서 탁월한 성능을 발휘한다”며 “에이전트 기능의 핵심인 지시사항 수행과 에이전틱 도구 활용 능력에서 GPT 5.1와 제미나이3보다 우위에 있다”고 강조했다.
모델 업그레이드와 더불어 맞춤형 프론티어 모델 구축을 돕는 서비스 ‘노바 포지’도 눈에 띈다. 이는 모델을 처음 만들 때부터 기업 특화 데이터를 반영할 수 있도록 한 서비스다. 가먼 CEO는 “모델을 더 많이 맞춤화하고 훈련 후 많은 데이터를 추가할수록, 모델은 이전에 배운 핵심적인 추론 과정을 잊어버리는 경향이 있다”며 “노바 포지는 모델의 핵심 기초 능력을 손상시키지 않으면서도 특화 지식을 도입할 수 있다”고 설명했다.
한편 AWS는 고객이 AI 에이전트를 잘 만들 수 있도록 지원하는 인프라와 베드록, 노바 생태계 이외에도 새로운 AI 에이전트 자체도 선보였다. ‘프론티어 에이전트(Frontier Agents)’는 개발자들이 소프트웨어를 구축·보안·운영하는 방식을 혁신하도록 지원하는 것을 목표로 한다.
개발 영역을 맡는 ‘키로 오토노머스 에이전트’는 버그 분류와 코드 커버리지 개선을 비롯해 가상 개발자 역할을 수행한다. ‘AWS 보안 에이전트’는 앱 설계, 코드 리뷰, 침투 테스트까지 수행하는 가상 보안 엔지니어이며, ‘AWS 데브옵스(DevOps) 에이전트’는 안정성 개선과 사고 예방 등 운영 전반을 담당한다. 가먼 CEO는 “이 에이전트들은 팀이 소프트웨어를 안전하게 구축하고 운영하는 방식을 완전히 변화시킬 것”이라고 말했다.
라스베이거스 안선제 기자
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
