컨텐츠 바로가기

04.26 (금)

이슈 슈퍼컴퓨터 시대

엔비디아, DGX GH200 AI 슈퍼컴퓨터 발표

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
디지털데일리

<이미지를 클릭하시면 크게 보실 수 있습니다>




[디지털데일리 김문기 기자] 엔비디아(CEO 젠슨 황)는 차원이 다른 대용량 메모리 AI 슈퍼컴퓨터 DGX GH200을 30일 발표했다.

엔비디아 DGX 슈퍼 컴퓨터는 엔비디아 GH200 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 탑재하고, 생성형 AI 언어 애플리케이션과 추천 시스템, 데이터 애널리틱스 워크로드에 사용될 차세대 거대 모델들의 개발을 지원한다.

방대한 공유 메모리 공간은 NVLink 인터커넥트 테크놀로지와 NVLink 스위치 시스템으로 GH200 슈퍼칩 256개를 결합해 단일 GPU로 기능하게 한다. 이를 통해 1엑사플롭(exaflop)의 성능과 144테라바이트의 공유 메모리를 제공하는데, 이는 단일 엔비디아 DGX A100 시스템 메모리의 500배에 가까운 용량이다.

젠슨 황 엔비디아 창립자 겸 CEO는 “생성형 AI와 대규모 언어 모델, 그리고 추천 시스템이 현대 경제의 디지털 엔진이다. DGX GH200 AI 슈퍼컴퓨터는 엔비디아의 가장 진일보한 가속 컴퓨팅과 네트워킹 테크놀로지를 통합해 AI의 영역을 확장한다”고 말했다.

GH200 슈퍼칩은 엔비디아 NVLink-C2C 칩 인터커넥트를 이용해 ARM 기반 엔비디아 그레이스 CPU와 엔비디아 H100 텐서 코어 GPU를 동일 패키지에 결합한다. GPU와 CPU 간 대역폭이 최신 PCIe 기술 대비 7배까지 증가해 상호 연결에 필요한 전력 소비가 5배 넘게 절감된다는 설명이다. DGX GH200 슈퍼컴퓨터를 위한 600GB의 호퍼 아키텍처 GPU 빌딩 블록이 확보된다.

DGX GH200은 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 페어링하는 최초의 슈퍼컴퓨터다. 이를 바탕으로 DGX GH200 시스템 내 모든 GPU가 하나로 작동한다. 이전 세대 시스템에서는 NVLink를 사용해 성능의 저하 없이 결합 가능한 GPU의 개수가 8개에 불과했다.

구글 클라우드와 메타, 마이크로소프트는 DGX GH200을 도입해 생성형 AI 워크로드 역량을 탐구한다. 엔비디아는 또한 클라우드 서비스 제공업체와 기타 하이퍼스케일러가 DGX GH200 설계를 청사진으로 삼아 자체 인프라로 커스터마이징 할 수 있도록 지원할 방침이다.

기리시 바블라니 마이크로소프트 애저 인프라스트럭처 부문 부사장은 “대규모 AI 모델 학습은 전통적으로 자원과 시간이 많이 소요되는 작업이다. 테라바이트 규모의 데이터세트를 처리할 수 있는 DGX GH200의 잠재력을 통해 개발자는 고급 연구를 더 큰 규모와 빠른 속도로 수행할 수 있다”고 말했다.

한편, 엔비디아는 자사 연구자와 개발팀을 지원할 DGX GH200 기반 AI 슈퍼컴퓨터를 자체 구축 중이다. 엔비디아 헬리오스(Helios)라는 이름의 이 슈퍼컴퓨터에는 DGX GH200 시스템 4개가 탑재된다. 헬리오스 슈퍼컴퓨터의 각 시스템은 최대 400Gb/s의 대역폭을 가진 엔비디아 퀀텀-2 인피니밴드 네트워킹으로 상호 연결해 대규모 AI 모델의 훈련을 위한 데이터 처리량을 극대화한다. 헬리오스는 그레이스 호퍼 슈퍼칩 1024개를 탑재하며, 올해 말 가동을 시작할 예정이다.

엔비디아 DGX GH200 슈퍼컴퓨터는 올해 안에 출시될 예정이다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.