<이미지를 클릭하시면 크게 보실 수 있습니다> |
글로벌 반도체 기업인 엔비디아가 인공지능(AI) 소프트웨어 영역까지 발을 넓힌다. 막대한 자본과 세계적인 인재를 빨아들이는 블랙홀이 된 엔비디아가 AI 업계에 새로운 지각변동을 일으킬지 주목된다.
26일(현지시간) 텍스트만으로 오디오 출력을 제어할 수 있는 생성형 AI 모델 '푸가토(Fugatto, Foundational Generative Audio Transformer Opus 1)'를 개발했다고 발표했다.
푸가토는 텍스트와 오디오 파일을 함께 학습해 명령어로 설명한 음악, 음성(가사 등), 사운드의 모든 조합을 생성하거나 변형할 수 있다. 다양한 오디오 생성과 변형 작업을 지원하는 푸가토는 여러 훈련된 능력의 상호 작용에서 나타나는 창발성(emergent property)을 보여주는 최초의 기초 생성형 AI 모델이다. 창발성은 물리학 등에서 전체 시스템에서 나타난 특성이 예상한 각개별 조합을 뛰어넘는 현상을 뜻한다.
푸가토는 연구팀이 음성 모델링, 오디오 보코딩, 오디오 이해와 같은 분야에서 쌓아온 이전 작업을 기반으로 하는 기초 생성형 트랜스포머 모델이다. 정식 버전은 25억 개의 파라미터를 사용하며, 32개의 엔비디아 H100 텐서 코어(Tensor Core) GPU가 탑재된 엔비디아 DGX 시스템을 통해 훈련됐다.
라파엘 발레 엔비디아 응용오디오연구팀 관리자는 "푸가토는 데이터와 모델 규모에 따라 오디오 합성과 변형에서 비지도 멀티태스크 학습이 가능한 미래를 향한 첫걸음"이라고 말했다.
엔비디아의 연이은 AI 소프트웨어 개발에 IT 업계는 개발 속도와 완성도를 두고 "충격적인 수준"이라고 설명한다.
IT 업계 관계자는 "엔비디아의 AI 소프트웨어 개발은 지금부터 시작일 것"이라며 "자사가 사실상 독점 중인 AI 반도체를 가장 많이 확보 하는 건 당연히 개발사일 수밖에 없다"고 말했다. 이어 "탄탄한 인프라와 배경 속에서 확보한 막대한 자본을 인재 확보와 개발에 투입한다면 당연히 최상의 시너지 효과가 날 수밖에 없다"고 밝혔다.
더불어 AI 업계 전반에서 나타나는 급속한 지형 변화를 고려할 때 엔비디아가 AI 소프트웨어 업계에서 메기효과(Catfish Effect)를 일으킬 수 있을 것으로 전망하고 있다. AI 소프트웨어 업계는 매월 급속히 인기 소프트웨어가 바뀌며 빠르게 재편되고 있다. 엔더슨 호로위츠가 조사한 바에 따르면 2024년 1월 기준, 4개월 전인 2023년 9월과 비교했을 때 1위부터 50위 중 40%가 새로운 기업으로 교체됐다.
나승두 SK증권 연구원은 "생성형 AI와 결합한 소프트웨어가 시장에서 주목받을 것"이라며 "제품이나 서비스의 생산 효율성을 극대화할 수 있는 AI 소프트웨어 기업에 집중할 시점"이라고 분석했다. 이어 "현재 AI 시장에서 나타나는 행태는 스마트폰 시장 변화와 비슷해 이제 혁신 SW 등장과 성장을 생각해 볼 수 있다"고 설명했다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.