컨텐츠 바로가기

04.25 (목)

“들리시죠, 기계음 아닌 나만의 목소리”…AI로 청각장애인 목소리 복원

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다

KT ‘마음을 담다’ 고객 캠페인

경향신문

청각장애인 김소희씨가 지난 2월22일 서울 KT융합기술원에서 수화 통역을 통해 자신의 목소리 복원 과정에 대한 설명을 듣고 있다. KT 제공

<이미지를 클릭하시면 크게 보실 수 있습니다>


가족 음성·대상자 성대 등 바탕

딥러닝 기술로 고유 샘플 다듬어

관련 영상 415만회 조회로 ‘반향’


김소희씨(47)는 선천성 청각장애인이다. 들을 수 없으니 말도 할 수 없었다. 죽기 전에 ‘내 목소리’로 가족과 대화하는 게 소원이었다. 그런 김씨가 KT를 만나 꿈을 이루게 됐다. 인공지능(AI) 음성합성 기술로 자기 목소리를 찾은 것이다. 이 기술은 성대 분석 등을 통해 잃어버린 목소리를 복원하는 작업이다. 이제 김씨가 하고 싶은 말을 애플리케이션(앱)이 깔려 있는 노트북이나 모바일 기기에 입력하면 생생한 목소리로 상대방에게 전달된다.

KT는 고객의 일상에 도움이 되는 기술을 개발하는 캠페인 ‘마음을 담다’의 일환으로 김씨의 목소리를 복원하는 데 성공했다고 1일 밝혔다. KT는 김씨의 목소리를 찾기 위해 먼저 동성 가족의 음성을 스튜디오에서 녹음했다. 그의 딸, 언니, 어머니의 목소리를 기초자료로 수집한 것이다. 두번째로 김씨의 성별, 구강 구조 등을 분석해 고유의 음색과 어조, 말투가 반영된 목소리를 생성했다. 마지막으로 이를 바탕으로 AI가 김씨의 목소리를 정교하게 가다듬었다.

경향신문

<이미지를 클릭하시면 크게 보실 수 있습니다>


박정석 KT융합기술원 팀장은 “목소리 모델링 작업으로 확보한 30분 분량의 김씨 음성 샘플을 기반으로 AI가 다양한 텍스트를 음성으로 바꾸는 반복 학습을 통해 목소리 품질을 고도화시켰다”고 말했다. 지난달 26일 유튜브에 공개된 김씨의 목소리 복원 과정이 담긴 <제 이름은 김소희입니다> 영상은 엿새 만에 415만회의 조회수를 기록했다.

해외에서는 역사 속 인물의 목소리를 복원해낸 사례도 있다. 지난 1월 로열홀로웨이런던대·요크대·리즈박물관 공동연구진은 고대 이집트 사제 ‘네시아문’의 미라에서 그의 생전 음성을 얻어냈다고 발표했다. 리즈박물관이 소장한 네시아문 미라의 구강 등 발성 통로를 컴퓨터단층촬영(CT)으로 스캔한 뒤 3차원(D) 프린팅 기술로 플라스틱 재질의 발성기관을 제작했다. 이어 인공 후두와 스피커를 연결해 3000년 전에 존재했던 목소리를 재현한 것이다.

프랑스 방송사 카날플러스는 드라마 <베르사유> 홍보를 위해 루이 14세의 목소리를 살려냈다. 이 프로젝트는 루이 14세의 신체상태와 진료기록 등의 자료가 구비돼 있었기 때문에 가능했다.

KT는 AI 기술 고도화를 통해 음성 분석 기반의 다양한 서비스를 제공하고 있다. 대표적으로 자사 고객센터 업무에 목소리 인증 방식을 적용 중이다. 기존에는 상담사가 일일이 고객을 상대로 이름과 생년월일, 주소를 묻는 방식으로 본인 확인을 했다면 요즘은 과거에 녹음된 고객 목소리와 통화 목소리를 비교해 본인 여부를 판별할 수 있다.

또 AI 스피커 ‘기가지니’가 사전에 녹음된 부모의 목소리를 학습해 아이에게 마치 부모인 것처럼 책을 읽어주는 <내 목소리 동화> 시범 서비스를 선보였다. 영어로 한 문장만 육성으로 녹음하면 복잡한 대화를 본인 목소리로 대신해주는 서비스와 다중 대화에서 특정인 목소리만 분리해주는 서비스도 상용화를 앞두고 있다.

지난해 10월 통신사에서 ‘AI 컴퍼니’로의 변신을 선언한 KT는 음성합성 기술 등을 개발하는 AI 분야에 향후 4년간 3000억원을 투자하고 전문인력 1000명을 채용할 계획이다.

구교형 기자 wassup01@kyunghyang.com

▶ 장도리 | 그림마당 보기

▶ 경향 유튜브 구독▶ 경향 페이스북 구독

©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.