젠슨 황 엔비디아 최고경영자(CEO)가 'CES 2025' 기조연설에서 최신 인공지능(AI) 가속기 '블랙웰(Blackwell)'을 탑재한 지포스 RTX 50 시리즈 그래픽 카드를 공개하고 있다./뉴스1 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
지난해 내내 설계 결함과 과열 등의 문제로 출시가 지연됐던 엔비디아의 차세대 인공지능(AI) 가속기 ‘블랙웰’이 출시 후에도 문제가 이어지고 있다. 마이크로소프트(MS), 아마존(AWS), 구글 등 주요 고객사들은 블랙웰 주문을 연기하거나 이전 세대 AI 칩을 요구하고 있는 것으로 알려졌다.
올해 메모리 반도체 업체들의 최대 수익처로 꼽히는 블랙웰 납품 문제가 장기화할 경우 SK하이닉스, 마이크론, 삼성전자 등에도 악영향이 불가피할 것으로 보인다. 올해 범용 D램, 낸드플래시, 기업용 솔리드스테이트드라이브(SSD) 시장 전망이 어두운 가운데 이익률이 가장 높은 최첨단 고대역폭메모리(HBM) 공급량이 기대치에 못 미친다면 직격타가 불가피하다.
13일(현지시각) IT 매체 디인포메이션에 따르면 MS와 AWS, 구글, 메타 플랫폼 등은 엔비디아의 ‘블랙웰 GB200′ 랙 주문 일부를 취소한 것으로 알려졌다. 블랙웰 칩이 장착된 랙의 첫 번째 출하분에 과열이 발생하고 칩 간 연결 방식에 문제가 발생하면서 일부 주문이 연기되고 취소됐다는 설명이다. 데이터센터에 사용되는 랙은 칩, 케이블 및 기타 필수 장비를 안전하게 담고 서로 연결하는 필수 장치다.
이는 올해 대규모 AI 서버 투자를 단행할 계획인 미국 주요 빅테크의 투자 계획에도 변수로 작용할 전망이다. 메타와 구글은 그레이스 블랙웰 GB200을 100억달러(약 13조9600억원) 이상 구매했고, MS는 자사뿐 아니라 오픈AI가 쓸 물량을 최대 6만5000개 주문한 것으로 알려졌다.
하지만 반도체 성능의 가장 큰 리스크인 발열 문제가 출시 이후 끊이지 않으면서 IT업계에선 신뢰성에 대한 불안이 고조되고 있다. 실제 챗GPT 개발사 오픈AI의 파트너사인 MS의 경우 애리조나 피닉스에 5만개 이상의 블랙웰 칩이 장착된 GB200 랙을 설치할 계획이었으나, 블랙웰에 잇단 결함이 발생하자 오픈AI가 MS에 이전 세대의 엔비디아 ‘호퍼’ 칩을 제공해달라고 요청한 것으로 알려졌다.
국내 대형 메모리업체 관계자는 “블랙웰 GB200의 발열 문제는 지난해부터 꾸준히 제기돼 왔고, 국내 최대 HBM 공급업체인 SK하이닉스에 지속적으로 전력효율 개선을 요청해왔다”며 “AI 데이터센터 전력의 상당 부분은 메모리에서 발생하는데 HBM은 기존 서버와 달리 2.5D 구조로 탑재되기 때문에 프로세서와 더 가까운 곳에 위치해 발열 문제가 더 치명적으로 작용한다”고 설명했다.
올해 성적이 HBM에 달려있는 국내 메모리 반도체 업체들은 불안한 시선으로 상황을 주시하고 있다. 엔비디아의 최신 GB200 NVL72 플랫폼에 최신형 HBM이 576개나 탑재될 정도로 많은 물량이 달려있기 때문이다. 블랙웰 결함 문제가 장기화할 경우 주력 공급사인 SK하이닉스의 실적에 직격타가 될 가능성이 높다.
황민규 기자(durchman@chosunbiz.com)
<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.