컨텐츠 바로가기

    12.06 (토)

    MS, 세계 최초 엔비디아 'GB300' 슈퍼컴퓨터 공개

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [박찬 기자]
    AI타임스

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    마이크로소프트(MS)가 엔비디아 최신 GPU '블랙웰 울트라'를 장착한 세계 최초의 ' GB300 NVL72' 슈퍼컴퓨팅 클러스터를 공개했다. 이 시스템은 오픈AI의 차세대 모델 훈련과 추론 작업을 위한 전용 인프라로 활용된다.

    사티아 나델라 MS CEO는 10일(현지시간) X(트위터)에 세계 최초의 GB300 NVL72 슈퍼컴퓨팅 클러스터의 영상을 공개했다.

    그는 "이번이 첫번째이며, 앞으로 전 세계 애저 데이터센터에 같은 규모의 시스템을 잇따라 배치할 것"이라고 밝혔다.

    이번 AI 팩토리는 총 4608개의 엔비디아 GB300 GPU 랙 시스템으로 구성돼 있으며, 초고속 '인피니밴드' 네트워크로 연결돼 있다. 엔비디아가 2019년 69억달러에 인수한 멜라녹스의 기술을 바탕으로 구현된 이 네트워킹 구조는 GPU 간 데이터 전송 속도를 비약적으로 높여, 랙당 초당 130TB의 메모리 대역폭과 GPU당 초당 800Gb의 연결 속도를 지원한다.

    각 NVL72 랙은 72개의 블랙웰 GPU와 36개의 '그레이스' CPU를 탑재하고 있으며, 랙 단위로 1440페타플롭스(PF)의 FP4 텐서 연산 성능을 제공한다.

    또 GPU용 'HBM3E' 20TB와 CPU용 'LPDDR5X' 17TB 등 총 37TB의 통합 메모리를 NVLink 5로 묶어 단일 가속기처럼 작동한다. MS는 이를 통해 "몇달이 걸리던 모델 학습을 몇주 안으로 단축할 수 있라고 설명했다.

    Another first for our AI fleet... a supercomputing cluster of NVIDIA GB300s with 4600+ GPUs and featuring next gen InfiniBand.

    First of many as we scale to hundreds of thousands of GB300s across our DCs, and rethink every layer of the stack across silicon, systems, and software… pic.twitter.com/EtNvnSAFr6

    — Satya Nadella (@satyanadella) October 9, 2025

    이번 클러스터를 시작으로 전 세계 34개국 300개 이상의 데이터센터에 수십만개의 블랙웰 울트라 GPU를 추가 배치할 계획이다. MS는 이를 "프론티어 AI의 요구를 충족시킬 수 있는 독보적 인프라"라고 강조하며, 앞으로 수백조개의 매개변수를 갖춘 차세대 모델까지 훈련할 수 있는 역량을 확보했다고 밝혔다.

    이미 MS는 오픈AI의 모델 학습을 위해 GB200 클러스터를 제공하고 있다. 지난 9월에는 내년 초 세계 최대 규모의 '페어워터' 데이터센터를 가동하며 오픈AI 모델 훈련을 지원하겠다고 밝혔는데, 이번에 공개한 GB300 클러스터도 여기에 탑재된다.

    MS는 엔비디아의 최대 고객이다. 이에 따라 몇년 전부터 최신 GPU를 탑재한 슈퍼컴퓨터를 가장 먼저 받아들었으며, 지난해에도 이를 자랑한 바 있다.

    박찬 기자 cpark@aitimes.com

    <저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.