네이버 GPU도 일정 기간 정상 속도 안 나와
국대AI, 제대로 파운데이션 모델 학습 못해
과기부 “초기 애로 있었지만 현재 정상 가동”
서울 중구 을지로 SK텔레콤 T타워 본사 건물. /SK텔레콤 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
SK텔레콤과 네이버가 ‘국가대표AI’ 기업들에 빌려주고 있는 GPU(그래픽 처리 장치)가 한동안 정상 속도를 내지 못한 것으로 확인됐다. 두 회사는 ‘소버린(독자적) AI’ 개발을 위한 국가대표 AI로 선정된 5개 컨소시엄에 포함돼 있고, 동시에 컨소시엄 기업들에 GPU를 임대하는 사업자이기도 하다.
19일 통신업계 관계자는 “SK텔레콤이 국대 AI에 빌려주는 GPU가 8월부터 약 한 달간 정상 속도를 내지 못한 것으로 안다”면서 “이로 인해 지난 8월 초 국대 AI에 선정된 기업들이 한동안 파운데이션 모델 학습을 제대로 하지 못했다”고 말했다. 정부는 앞서 지난 7월 ‘독자 AI 모델 구축을 위한 GPU 임차 사업자 선정’ 공모에서 최신 GPU인 B200을 1000장 설치하는 부문에 SK텔레콤을 선정했다. 이에 따라 SK텔레콤은 지난 8월부터 내년 6월까지 GPU를 국대 AI 기업들에 빌려줘야 한다.
그런데 SK텔레콤이 국대 AI에 제공한 GPU는 초기부터 정상 속도를 내지 못했다고 한다. 국대 AI 기업들은 SK텔레콤이 제공하는 GPU 속도가 기존에 자신들이 쓰던 GPU보다 지나치게 떨어져 정상적으로 AI 모델 학습을 하기 어려웠던 것으로 알려졌다. 결국 과기정통부가 문제를 해결하기 위해 지난 9월 국대 AI 기업들을 모아 비공개 간담회를 열었고, SK텔레콤은 “각 기업의 개발 환경과 개발 코드 간 호환성이 맞지 않는 문제”라고 설명했다고 한다. 과기정통부 관계자는 “초기에 애로가 있었던 것은 맞다. 각 모델과 GPU 인프라를 연동하는 과정에서 최적화에 시간이 걸린 것으로 파악하고 있다”면서 “현재는 문제를 해결해 정상적으로 GPU가 돌아가고 있다”고 말했다.
일각에선 GPU 속도 저하로 한 달간 제대로 쓰지 못한 국대 AI 기업들이 상대적 불이익을 당할 수 있다고 지적한다. 정부가 주관하는 올해 말 1차 평가에서 국대 AI 5팀 중 1팀이 탈락하는데, SK텔레콤 GPU를 임차한 회사는 한 달 동안 어려움을 겪어 불리하다는 것이다.
GPU 속도 저하에 대해 SK텔레콤 관계자는 “SK텔레콤의 인프라 이슈가 아니고, 해당 기업이 엔비디아의 가이드를 받아 해결했다”며 “정상 속도가 나오지 못한 기간도 한 달 이상은 아닌 것으로 파악하고 있다”고 말했다.
한편 또 다른 GPU 임대 사업자이자 국대 AI인 네이버클라우드가 제공하는 GPU도 일정 기간 정상 속도를 내지 못한 것으로 알려졌다. 네이버클라우드는 엔비디아의 H200 1000장을 국대 AI 기업에 빌려주고 있다. 그러나 비슷한 문제로 인해 국대 AI 기업이 사업 초기 제대로 GPU를 사용하지 못한 것으로 전해졌다.
[김강한 기자]
- Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
