아마존이 연례 컨퍼런스 'AWS 리인벤트(re:Invent) 2023'에서 머신러닝 트레이닝과 AI 트레이닝을 포함한 다양한 워크로드에서 성능 향상을 실현하는 프로세서 '그라비톤(Graviton)4'와 '트레이니움(Traineium)2'를 29일 발표했다.
AWS에서는 150개 이상의 다양한 그라비톤 기반 Amazon EC2 인스턴스(AWS 클라우드 환경의 가상 서버)가 제공되고 있으며, 200만 개 이상의 그라비톤 프로세서를 통해 F1, 닐슨, 핀터레스트, 스트라이프 등 5만 개 이상의 고객이 다양한 워크로드를 실행하고 있다.
클라우드에 대규모 인메모리 데이터베이스와 분석 워크로드가 도입됨에 따라 요구사항은 점점 더 까다로워지고 있다. 2021년 11월에 발표된 그라비톤3의 후속 프로세서인 '그라비톤4'가 이를 해결해 줄 것으로 기대하고 있다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
AWS Graviton4 및 AWS Trainium2(프로토타입). 사진=AWS 제공
그라비톤4는 3에 비해 코어가 50%, 메모리 대역폭이 75% 증가해 연산 능력이 최대 30% 향상됐다. 아마존 EC2에서 실행되는 다양한 워크로드에 대해 최고의 가성비와 에너지 효율을 제공한다는 설명이다.
그라비톤4는 새로운 메모리 최적화 인스턴스인 R8g 인스턴스에서 사용할 수 있다. 고성능 데이터베이스, 인메모리 캐시, 빅데이터 분석 등 메모리 부하가 높은 워크로드를 개선한다. 또한, 모든 고속 물리 하드웨어 인터페이스를 완전히 암호화해 보안을 강화했다고 강조했다.
R8g 인스턴스는 기존 R7g 인스턴스 대비 vCPU가 최대 3배, 메모리가 3배 더 높은 성능을 갖추고 있다. 따라서 워크로드 실행 시 결과 도출까지 걸리는 시간이 단축돼 최종 비용 절감으로 이어질 것으로 기대된다.
그라비톤4 기반 R8g 인스턴스는 프리뷰를 거쳐 향후 수개월 내로 일반에 공개될 예정이다.
한편, 트레이니움2는 머신러닝 칩 '트레이니움'의 최신 버전으로 기존 대비 최대 4배 빠른 트레이닝이 가능하다. Amazon EC2 Trn2 인스턴스에서 사용할 수 있으며, 단일 인스턴스에 16개의 트레이니움2 칩이 탑재되어 있다.
Trn2 인스턴스는 아마존 일래스틱 컴퓨트 클라우드(EC2)로 고성능 머신러닝 워크로드용 아마존 EC2 울트라클러스터(UltraCluster)를 최대 10만 칩까지 확장하고, AWS EFA(Elastic Fabric Adapter) 페타비트 스케일 네트워킹과 상호 연결하여 초당 최대 65 EFlops라는 슈퍼컴퓨터급 성능을 이용할 수 있도록 하는 것을 목표로 하고 있다.
이를 통해 기존에는 3000억 개의 파라미터를 가진 대규모 언어 모델 훈련에 수개월이 걸리던 것을 몇 주 만에 단축할 수 있다고 한다. 또한, 기초 모델과 대규모 언어 모델을 단시간에 훈련할 수 있어 에너지 효율도 최대 2배까지 향상됐다고 발표했다.
트레이니움2 기반의 Trn2 인스턴스 제공 시기는 아직 발표되지 않았다.
김한비 기자 itnews@
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.