피터 데산티스 AWS 유틸리티 컴퓨팅 수석부사장이 4일(현지시간) 미국 라스베이거스에서 열린 'AWS 리:인벤트 2025'에 참석해 기조연설을 진행하고 있다. /사진=임경호 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
아마존웹서비스(AWS)가 연례 기술 컨퍼런스 'AWS 리:인벤트 2025'를 통해 AI를 보다 효율적으로 사용하기 위한 인프라와 구조적 효율성을 강조했다. AI 워크로드가 급증하면서 냉각부터 칩, 서버 구조, 스토리지, 서버리스 아키텍처까지 클라우드의 '펀더멘털'적 요소들이 중요성을 더하고 있다는 설명이다.
그래비톤5·M9g 성능 공개...AI 처리 효율↑
AWS는 4일(현지시간) 이전 세대 대비 컴퓨팅 성능을 25% 향상한 5세대 맞춤형 프로세서 '그래비톤5'을 공개했다. 데이브 브라운 AWS 컴퓨트 및 머신러닝 서비스 담당 부사장은 이날 미국 라스베이거스에서 열린 기조연설을 통해 "이는 엄청난 세대 간 발돋움을 의미한다"고 말했다.
데이브 브라운 AWS 컴퓨트 및 머신러닝 서비스 담당 부사장이 4일(현지시간) 미국 라스베이거스에서 열린 'AWS 리:인벤트 2025'에 참석해 기조연설을 진행하고 있다. /사진=임경호 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
이번 기조연설은 AWS가 자사 주요 서비스를 AI 시대에 맞게 재설계해 나가고 있는 과정을 집중적으로 조명했다. '그래비톤5'도 성능을 끌어올리는 동시에 에너지 효율성을 높여 애플리케이션을 더 빠르게 실행하면서 비용까지 절감할 수 있도록 설계된 점이 강조됐다.
'그래비톤5'는 고속 메모리 버퍼인 L3 캐시 용량을 기존보다 5배로 확대했으며 코어는 이전 세대 대비 2.6배 많은 L3 캐시에 접근할 수 있다. 이를 통해 아마존 EC2에서 구동되는 다양한 클라우드 워크로드에 최적의 가격 대비 성능을 제공한다는 평가가 나온다.
'그래비톤5' 기반 범용 9세대 칩 'EC2 M9g' 인스턴스는 단일 패키지당 192개 코어를 제공하며 이전 세대 대비 비용 효율성을 25% 높였다. 코어 간 데이터 이동 거리를 줄여 통신 지연 시간을 최대 33% 단축했고 대역폭도 확장했다. AWS가 신규 데이터센터에 배포하는 인스턴스의 절반을 차지할 정도로 활용도가 높다.
고객사에서도 효과가 확인되고 있다. 에어비앤비는 다른 시스템 아키텍처를 사용할 때보다 25% 높은 성능을 확인했고, SAP는 이전 세대 대비 60%의 성능 향상을 기록했다. 이는 동일한 애플리케이션을 더 작은 인스턴스 규모에서 구동할 수 있다는 뜻으로 그만큼의 인프라 비용 절감 효과가 뒤따른다.
'우선순위'로 낭비 줄여...트웰브랩스, 벡터 활용 사례 공유
냉각 구조의 변화도 소개했다. 기존 서버가 실리콘 위에 여러 층의 인터페이스 소재를 올리는 전통적 공법을 사용해 왔다면 AWS는 칩·서버·데이터센터를 모두 설계·운영한다는 점을 활용해 실리콘에 보다 직접 접근하는 새로운 냉각 방식을 제시했다. 이를 통해 열 저항을 줄이고 의미 있는 수준의 전력 절감 효과를 얻었다는 것이 AWS 측 설명이다.
데이브 브라운 AWS 컴퓨트 및 머신러닝 서비스 담당 부사장이 4일(현지시간) 미국 라스베이거스에서 열린 'AWS 리:인벤트 2025'에 참석해 기조연설을 진행하고 있다. /사진=임경호 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
대규모 AI 인퍼런스를 위한 전용 인프라도 공개됐다. AWS는 추론 요청이 토크나이제이션, 프리필, 디코딩, 디토크나이제이션 등 여러 단계를 거치면서 서로 다른 리소스가 각기 다른 패턴으로 소모되는 기존 구조의 한계를 지적했다. 이를 해소하기 위해 고객 요청 유형에 따라 '우선순위'를 부여해 실시간성이 중요한 요청과 지연에 민감하지 않은 작업을 분리 처리할 수 있도록 했다.
스토리지 계층에서도 변화가 소개됐다. 기존 행·열 중심의 정형 데이터베이스나 검색 엔진에서 벗어나 이미지, 텍스트, 영상, 오디오 등 비정형 데이터를 하나의 임베딩 공간에 매핑하는 벡터 기반 검색 방식으로 확장하는 흐름을 설명했다.
피터 데산티스 AWS 유틸리티 컴퓨팅 수석부사장은 "행과 열로 저장하는 기존 데이터베이스와 달리 벡터는 수백만 차원의 고차원 벡터로 데이터를 저장해 벡터 공간 내에서 가장 가까운 개체를 수학적으로 찾는 방식"이라고 설명했다.
이어 "비정형 데이터는 서로 다른 임베딩 모델을 사용해야 했던 한계가 있었는데 '노바 멀티모달 임베딩'을 통해 민첩성을 높이면서 비용 절감 효과도 얻을 수 있게 됐다"며 "AWS는 포트폴리오 전반에 걸쳐 깊이와 폭을 동시에 갖춘 접근법을 취하고 있다"고 강조했다.
벡터 활용 사례로는 이재성 트웰브랩스 대표가 무대에 올라 영상 데이터를 다루는 데 드는 비용을 크게 절감한 경험을 공유했다. 이는 트웰브랩스의 API와 파운데이션 모델을 활용하는 고객에도 동일한 이익으로 이어진다는 점을 보여준다는 설명이다. 트웰브랩스는 '아마존 베드록' 기반에서 영상 검색·분석 모델인 '마렝고'와 '페가수스'를 서비스 중이다.
트레이니움으로 AI 칩 로드맵 지속..."변혁은 이제 시작"
AI를 위한 자체 칩 '트레이니움' 관련 내용도 이어졌다. AWS는 트레이니움을 통해 비용 효율적인 AI 인프라 투자를 지속하고 있다. 맷 가먼 AWS CEO는 이틀 전 기조연설에서 "트레이니움3에 이어 다음 세대 개발에도 이미 착수했다"고 밝힌 바 있다.
피터 데산티스 AWS 유틸리티 컴퓨팅 수석부사장이 4일(현지시간) 미국 라스베이거스에서 열린 'AWS 리:인벤트 2025'에 참석해 기조연설을 진행하고 있다. /사진=임경호 기자 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
피터 수석부사장은 "'트레이니움3'은 가장 까다로운 AI 워크로드에서도 40% 낮은 비용으로 제공한다"며 "수십억달러 규모의 비용 구조에 대입하면 이는 엄청난 절감 효과"라고 말했다. 아마존 EC2 Trn3 울트라서버에는 144개 트레이니움3 칩이 장착돼 있다.
그는 "이런 변화에도 불구하고 우리는 아직 변혁의 시작점에 서 있다"며 "새로운 아키텍처가 계속 등장할 것이고 그에 따라 엄청난 가능성이 펼쳐질 것"이라고 말했다.
한편 이날 오후에는 버너 보겔스 아마존 최고기술책임자(CTO)가 올해 행사의 마지막 기조연설을 장식한다.
그는 AI 시대 확장성과 안정성 등을 두루 갖춘 솔루션을 만들기 위해 필요한 도구, 패턴, 개발 방식이 어떻게 진화하고 있는지 소개한다. 또 AI 혁신이 AWS 내부 소프트웨어 개발 및 운영 방식을 어떻게 변화시키고 있는지도 함께 전할 예정이다.
라스베이거스(미국)=임경호 기자 lim@techm.kr
<저작권자 Copyright ⓒ 테크M 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
