컨텐츠 바로가기

    12.06 (토)

    이슈 인공지능 시대가 열린다

    레드햇 AI 플랫폼, AWS '트레이니움·인퍼런시아' 품었다…“가성비 최대 40%↑”

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    전자신문

    [사진= 레드햇 제공]

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    레드햇이 아마존웹서비스(AWS)의 자체 개발 인공지능(AI) 반도체를 지원한다. 엔터프라이즈 AI 시장에서 협력을 강화해 가격 대비 성능(가성비)을 앞세운 'AI 추론' 주도권을 잡겠다는 포석이다.

    레드햇은 2일(현지시간) 미국 라스베이거스에서 열린 'AWS 리인벤트 2025'에서 AWS와 협력을 확대하고, AWS의 AI 칩 '트레이니움'과 '인퍼런시아'를 지원한다고 발표했다.

    협력의 핵심은 레드햇 AI 인퍼런스 서버가 AWS의 최신 AI 가속기 '인퍼런시아2'와 '트레이니움3' 환경에서 구동된다는 점이다. 거대언어모델 최적화 엔진(vLLM) 기반의 레드햇 AI 인퍼런스 서버는 다양한 생성형 AI 모델을 지원하는 공통 추론 레이어를 제공한다.

    레드햇 측은 “AWS AI 칩을 활용할 경우 기존 GPU 기반 아마존 EC2 인스턴스 대비 가격 대비 성능을 최대 30~40%까지 향상할 수 있다”고 설명했다. 기업은 더 낮은 지연 시간과 비용 효율성을 바탕으로 AI 워크로드를 대규모로 확장할 수 있게 된다.

    양사는 하이브리드 클라우드 플랫폼인 레드햇 오픈시프트와 AWS 하드웨어의 연동성도 강화했다. 이를 위해 'AWS 뉴런' 오퍼레이터를 새롭게 개발했다. 고객은 레드햇 오픈시프트 AI 환경에서 AWS의 AI 가속기를 손쉽게 활용해 모델 학습과 추론을 수행할 수 있다.

    레드햇은 오픈소스 커뮤니티 기여도 확대한다. vLLM 프로젝트에 AWS AI 칩 플러그인을 최적화하는 작업을 진행 중이다. 이는 대규모 추론을 위한 오픈소스 프로젝트의 기반 기술로, 레드햇 오픈시프트 AI 3에서 상용 기능으로 제공된다.

    조 페르난데스 레드햇 AI 사업부 부사장은 “이번 협력은 하이브리드 클라우드 환경 전반에서 생성형 AI 접근성과 비용 효율성을 높이는 것이 목표”라며 “고객이 유연성을 바탕으로 AI 워크로드를 배포하고 확장하도록 지원하겠다”고 말했다.

    류태웅 기자 bigheroryu@etnews.com

    [Copyright © 전자신문. 무단전재-재배포금지]


    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.