<이미지를 클릭하시면 크게 보실 수 있습니다> |
아마존웹서비스(AWS)가 자체 인공지능(AI) 칩을 탑재한 새로운 데이터센터 서버를 공개하며 엔비디아와의 본격적인 경쟁을 예고했다.
AWS는 3일(현지시간) 연례 클라우드 컨퍼런스 '리인벤트'에서 AI 칩 '트레이니엄2(Trainium2)' 64개로 구성된 데이터센터 서버 'Tm2 울트라서버(Tm2 UltraServer)'를 선보였다.
이 서버는 프론티어 파운데이션 모델의 학습 및 추론 작업을 지원하며, FP8 연산 시 단일 워크로드에서 332페타플롭스(PF)의 성능을 발휘한다. 기존 EC2 AI 서버 대비 5배 높은 컴퓨팅 용량과 10배 더 큰 메모리를 제공한다.
Tm2 울트라서버는 엔비디아의 '블랙웰' 칩 72개를 탑재한 서버가 경쟁 대상이다. 두 회사 모두 칩 연결을 위한 독자 기술을 보유하고 있지만, AWS는 자신들이 엔비디아보다 더 많은 칩을 연결할 수 있다고 강조했다.
가디 허트 AWS AI 칩 사업 개발 책임자는 "트레이니엄2를 활용하면 현재 엔비디아 칩을 사용하는 것보다 더 강력한 컴퓨팅 성능과 비용 절감 효과를 누릴 수 있다"라며 "특정 AI 모델의 학습 비용을 엔비디아 칩 대비 최대 40%까지 줄일 수 있다"라고 설명했다.
특히 AWS의 주요 파트너인 앤트로픽이 Tm2 울트라서버를 적극 활용할 예정이다.
맷 가먼 AWS CEO는 "AWS는 앤트로픽과 함께 '프로젝트 레이니어(Project Rainier)'라는 이름으로 EC2 울트라클러스터를 구축하고 있다"라며 "이 클러스터에는 수십만 개의 트레이니엄2 칩이 탑재될 것"이라고 밝혔다.
이어 "앤트로픽은 기존에 클로드 모델을 통해 뛰어난 성과를 보였으며, 이번 클러스터를 통해 컴퓨팅 성능을 5배 향상해 새로운 가능성을 열 것으로 기대된다"라고 말했다.
애플도 이 칩을 AI 모델 훈련에 사용하는 것으로 밝혀졌다.
베누아 듀팽 애플 임원은 "10년 이상 AWS와 긴밀히 협력해 왔으며, 이번에는 트레이니엄2 칩을 활용해 AI 모델을 사전 훈련할 계획"이라고 밝혔다. 그는 "이를 통해 효율성이 최대 50% 향상될 것으로 기대한다"라고 덧붙였다.
AWS는 Tm2 울트라서버와 울트라클러스터가 내년 중 가동될 예정이라고 밝혔으나, 구체적인 일정은 공개하지 않았다.
엔비디아와 AWS 모두 급증하는 시장 수요에 맞추기 위해 제품 출시를 서두르지만, 엔비디아는 공급망 문제로 인해 배송에 어려움을 겪고 있는 반면 AWS는 비교적 안정적인 공급망을 유지하고 있다고 설명했다. 두 회사 모두 칩 제조는 대만 TSMC에 의존하고 있다.
한편, AWS는 내년 중 차세대 AI 칩인 트레이니움3를 출시할 계획이라고 발표했다.
가먼 CEO는 "이번 제품은 첨단 생성 AI의 학습과 추론을 위해 고도화된 워크로드에 최적화된 설계"라고 강조했다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.