초고성능 GPU 클러스터 설계…글로벌 상위권 규모
학습 기간 18개월→1.5개월…개발 사이클 향상 기대
독자 파운데이션 모델 고도화…서비스·산업 적용
각세종 서버실(사진=네이버) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
네이버는 이번 인프라 구축으로 글로벌 상위권 수준의 컴퓨팅 파워를 확보했으며, 독자 파운데이션 모델 고도화와 AI 기술의 서비스·산업 적용을 가속할 수 있는 기반을 마련했다고 설명했다.
회사 측에 따르면 ‘B200 4K 클러스터’는 냉각·전력·네트워크를 포함한 초고성능 GPU 클러스터 설계 역량을 바탕으로 구축됐다. 대규모 병렬 연산과 고속 통신을 전제로 설계돼 글로벌 톱 수준의 슈퍼컴퓨터와 비교 가능한 규모를 갖췄다는 평가다.
인프라 성능 향상은 AI 모델 개발 속도 개선으로 이어진다. 네이버는 내부 시뮬레이션 결과, 720억 개(72B) 파라미터 규모 모델을 학습할 경우 기존 A100 GPU 2048장 기반 인프라에서는 약 18개월이 소요됐으나, 이번 클러스터에서는 약 1.5개월로 단축될 수 있다고 밝혔다. 이는 학습 속도가 12배 이상 빨라지는 효과다. 다만 실제 학습 기간은 과제와 설정에 따라 달라질 수 있다고 덧붙였다.
네이버는 학습 효율 향상으로 대규모 실험과 반복 학습이 가능해지면서 모델 완성도와 개발 유연성이 크게 높아질 것으로 보고 있다. 이를 바탕으로 텍스트뿐 아니라 이미지·비디오·음성을 동시에 처리하는 옴니(Omni) 모델 등 독자 파운데이션 모델 고도화에도 속도를 낼 계획이다.
최수연 네이버 대표는 “이번 인프라 구축은 AI 기술 경쟁력과 자립 기반을 강화하는 핵심 자산”이라며 “빠른 학습과 반복 실험이 가능한 환경을 토대로 AI 기술을 서비스와 산업 현장에 유연하게 적용해 나가겠다”고 말했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
