컨텐츠 바로가기

    12.13 (토)

    이슈 IT기업 이모저모

    구글클라우드, 추론용 AI칩 '아이언우드' 출시

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    [디지털데일리 김보민기자] 구글클라우드가 컴퓨팅 성능을 강화하기 위해 신규 추론용 인공지능(AI)칩을 공개했다.

    구글 클라우드는7세대 텐서처리장치(TPU) '아이언우드(Ironwood)'를 정식 출시한다고 6일(현지시간) 발표했다. 이를 통해 기업 고객에게 AI 추론과 범용 컴퓨팅 워크로드 전반에서 성능 및 효율성 혁신을 제공할 계획이다.

    아이언우드는 대규모 모델 학습 및 강화학습(RL), 대용량·저지연 AI 추론 등을 처리하도록 설계됐다. TPU v5p 대비 최대 10배 향상된 성능과 트릴리움(TPU v6e) 대비 칩당 최대 4배 향상된 학습 및 추론 작업 성능을 제공할 수 있다.

    아이언우드는 구글클라우드 통합 AI 슈퍼컴퓨팅 시스템 'AI 하이퍼컴퓨터(Hypercomputer)'의 핵심 구성 요소다. 컴퓨팅·네트워킹·스토리지·소프트웨어를 통합해 시스템 전반의 성능과 효율성을 높인다.

    최대 9216개 칩으로 구성된 슈퍼포드(superpod)로 확장할 수 있고, 이를 통해 1.77 페타바이트(PB) 규모의 공유 고대역폭 메모리(HBM)에 접근해 AI 모델에서 발생하는 데이터 병목 현상을 최소화한다.

    이외에도 광회로 스위칭(OCS) 기술을 적용해 네트워크 장애가 발생해도 실시간으로 경로를 재구성할 수 있다. 성능 향상이 필요한 경우에는 수십만 개의 TPU를 클러스터로 확장할 수 있다.

    활용 사례도 늘고 있다. 앤트로픽(Anthropic)은 아이언우드를 바탕으로 대규모 클로드(Claude) 모델 학습부터 서비스 환경을 구축하고 있다. 앤트로픽은 향후 최대 100만 개의 TPU 사용을 계획하고 있다.

    한편 구글 클라우드는 이번 발표를 통해 ARM 네오버스 기반 맞춤형 중앙처리장치(CPU) '액시온' 제품군도 확장했다. 아이언우드가 모델 서비스의 복잡한 작업을 처리하는 동안 액시온은 고용량 데이터 준비, 수집, 지능형 애플리케이션 호스팅과 같은 운영 상의 백본(backbone) 역할을 수행한다.

    이번에 프리뷰 버전으로 공개된 N4A는 구글 클라우드의 두 번째 범용 액시온 가상머신(VM)이다. 마이크로서비스, 컨테이너화된 애플리케이션, 오픈소스 데이터베이스, 데이터 분석 및 웹 서비스 작업 등에 이상적이다.

    구글클라우드의 첫 Arm 기반 베어메탈 인스턴스(bare-metal instance) 'C4A 메탈(C4A metal)'도 프리뷰 버전으로 출시된다. C4A 메탈은 안드로이드 개발, 차량 내 시스템, 엄격한 라이선스가 필요한 소프트웨어 등 워크로드를 위한 전용 물리 서버를 제공한다.

    구글 클라우드는 액시온 포트폴리오에 N4A, C4A, C4A 메탈을 포함한 세 가지 옵션을 제공함으로써, 고객이 원하는 성능과 워크로드별 요구사항에 부응하면서도 비즈니스 운영의 총비용을 낮출 수 있도록 지원할 계획이다.

    마크 로메이어(Mark Lohmeyer) 구글 클라우드 AI 및 컴퓨팅 인프라 부문 부사장 겸 총괄 매니저는 "하드웨어부터 소프트웨어, 관리형 서비스까지 통합된 풀 스택 AI 하이퍼컴퓨터를 바탕으로 고객은 아이언우드와 액시온을 비롯한 다양한 컴퓨팅 옵션을 조합해 워크로드에 유연성과 성능을 확보할 수 있을 것"이라고 말했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.