컨텐츠 바로가기

    12.06 (토)

    이슈 인공지능 시대가 열린다

    "아마존 첫 3나노 AI 칩"…AWS '트레이니움3 울트라서버' 공개

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다

    "트레이니움2 대비 컴퓨팅 성능 4.4배·전력 효율 4배"

    100만개 칩 연결 가능한 울트라클러스터 3.0 구축 가능

    뉴스1

    아마존웹서비스(AWS) 로고 ⓒ AFP=뉴스1

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    (서울=뉴스1) 김민석 기자 = 아마존웹서비스(AWS)가 자사 첫 3나노미터(㎚) 인공지능(AI) 칩 '트레이니움3'(Trainium3)를 탑재한 '아마존 EC2 Trn3 울트라서버'(Amazon EC2 Trn3 UltraServers)를 공개했다고 3일 밝혔다.

    AWS 관계자는 "트레이니움3는 이전 세대 대비 컴퓨팅 성능은 4.4배, 전력 효율은 4배 높아졌다"며 "메모리 대역폭도 약 4배 향상됐다"고 말했다.

    이어 "Trn3 울트라서버는 최대 144개 트레이니움3 칩을 지원하며 최대 362 FP8 페타플롭스(PFLOPs)의 연산 성능을 제공한다"며 "이를 통해 모델 훈련 기간을 수개월에서 수주로 단축하고 추론 요청 처리량을 크게 높였다"고 설명했다.

    AWS는 오픈AI의 공개 모델 'GPT-OSS'를 활용한 내부 테스트에서 트레이니움2 울트라서버 대비 칩당 처리량은 3배, 응답 속도는 4배 향상됐다고 전했다.

    Trn3 울트라서버는 칩 간 데이터 이동을 가속한 '뉴런스위치'(NeuronSwitch)-v1와 '뉴런 패브릭'(Neuron Fabric) 네트워크를 적용해 지연 시간을 10마이크로초 미만으로 낮췄다.

    이를 통해 수천 개 Trn3 울트라서버를 연결한 'EC2 울트라클러스터 3.0'을 구성할 수 있다.

    AWS는 엔비디아 NV링크 퓨전(NVLink Fusion)을 지원해 트레이니움과 GPU를 통합 운용할 수 있는 공통 랙 환경을 구현할 계획이다.

    AWS 관계자는 "앤트로픽, 리코, 스플래시뮤직 등 주요 고객들은 트레이니움 기반 훈련·추론 환경을 운영하고 있고 자사 베드록(Amazon Bedrock)도 트레이니움3 인프라로 프로덕션 워크로드를 구동하고 있다"며 "이를 통해 훈련·추론 비용을 기존 대비 최대 50% 절감했다"고 했다.

    이어 "트레이니움3에 이어 차세대 버전인 트레이니움4도 개발하고 있다"며 "차세대 칩은 기존 대비 FP4 성능 6배, FP8 성능 3배, 메모리 대역폭 4배 향상을 목표로 설계했다"고 했다.

    ideaed@news1.kr

    Copyright ⓒ 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지. <용어설명> ■ 트레이니움 트레이니움(Trainium)은 AWS가 설계한 AI 학습용 칩으로 대규모언어모델(LLM)·파운데이션 모델(FM) 학습에 최적화한 가속기다. ■ NV링크 NVLink는 엔비디아가 개발한 고속 GPU 간 상호 연결(인터커넥트) 기술이다. 기존 PCI Express(PCIe)보다 높은 대역폭과 낮은 지연 시간으로 여러 GPU 또는 GPU와 CPU를 직접 연결해 대용량 데이터를 처리할 수 있다. ■ ASIC ASIC(Application-Specific Integrated Circuit·주문형 반도체)은 특정 용도 맞춤으로 제작된 집적 회로를 의미한다. 범용으로 쓰이는 GPU와 달리 특정 기능이나 특정 애플리케이션에 최적화 설계돼 고성능·저전력을 구현한다.
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.