컨텐츠 바로가기

10.31 (목)

MS가 만든 AI 목소리 “너무 사람 같아서...”

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
MS 연구진, AI 음성 기술 아카이브 발표
사람과 구별할 수 없을 정도의 성능 선보여
“악용 우려로 대중에게 공개 계획 없어”


매일경제

AI가 노래를 부르고 있는 모습을 형상화한 그림 [그림=뤼튼]

<이미지를 클릭하시면 크게 보실 수 있습니다>


마이크로소프트(MS)가 자사가 개발한 인공지능(AI) 음성 생성기를 공개하지 않기로 했다. 이유는 사람과 너무 똑같기 때문이다.

MS 연구진은 출판 전 논문 공개 사이트인 ‘아카이브’에 최근 ‘밸리-2(VALL-E2)’라 이름 붙인 AI 음성 생성기를 공개했다. 연구진은 논문을 통해 “인간의 수행 능력과 비슷할 정도로 정확하고 자연스러운 음성을 생성할 수 있다”라며 “실제 사람으로 착각할 만큼의 성능을 보였다”라고 밝혔다.

연구진에 따르면 VALL-E2는 복잡하거나 반복적인 구문을 줘도 고품질의 음성을 만들어 냈으며 이 분야에서 처음으로 인간과 동등한 수준을 달성했다고 설명했다. 라이브사이언스는 이 소식을 전하면서 “인간적 동등성이란 VALL-E2에서 생성한 음성이 MS에서 벤치마크로 사용하는 인간 음성 품질과 동등하거나 더 우수함을 뜻한다”라고 설명했다. MS의 이러한 기술은 향후 교육, 엔터테인먼트, 대화형 음성 응답 시스템, 번역, 챗봇 등에 사용될 것으로 기대된다.

다 이러한 성능에도 불구하고 MS는 잠재적인 오용의 위험성 때문에 VALL-E2를 대중에게 공개하지 않기로 했다. MS 연구진은 블로그를 통해 “VALL-E2는 순수하게 연구 프로젝트”라며 “VALL-E2를 제품에 넣거나 대중에게 공개할 계획이 현재로서는 없다”라고 말했다.

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.