인공지능 이미지(게티이미지뱅크) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
영어와 일본어, 프랑스어, 중국어 등 최대 10개국어로 동시에 이야기해도 각각의 언어를 구분해 알아듣는 음성인식기술이 개발됐다.
기존 음성인식기술은 특정 언어만 인식했지만 새로 개발된 기술을 이용하면 국제공항 등 여러 나라 말이 뒤섞여 오가는 장소에서도 활용이 가능할 것으로 기대된다.
아사히(朝日)신문에 따르면 미쓰비시(三菱)전기는 19일 이런 기술을 적용한 공항로비 안내판을 이용한 시연회를 언론에 공개했다. 시연회에서는 두 사람이 안내판을 향해 동시에 영어로 '목걸이를 사고 싶다', 일본어로 '중국요리가 먹고 싶다'고 말하자 영어로 보석가게의 위치와 중국식당의 위치가 동시에 표시됐다. 이 기술을 적용하면 발음사전 등 언어별 전문지식이 필요없다고 한다.
인공지능(AI) 기술의 하나로 신경회로를 모방한 '뉴럴 네트워크'를 적용한 '심층학습'을 이용했다. 음성과 문자열의 시간적 관계를 추정하는 방법과 문자열의 소리와 문장의 연결을 중시해 추정하는 방법을 종합했다고 한다.
복수의 언어를 학습하도록 해 음성인식률은 일본어, 영어, 프랑스어, 독일어, 이탈리아어 등 5개 언어의 경우 90% 이상, 중국어와 스페인어, 포르투갈어, 러시아어, 네덜란드어를 합한 10개 언어의 인식률은 80% 이상이다.
인터넷 등에 접속하지 않고 게임용 PC나 소형 컴퓨터만으로도 이용할 수 있다. 복수의 언어로 대화하는 영상대화를 문자로 바꾸는 용도 등에 이용할 수 있을 것으로 보인다. 앞으로 잡음 등 소음이 심한 환경에서 어느 정도 인식이 가능한지 등 실용성을 확인하는 시험을 거쳐 실용화한다는 계획이다.
이 회사 연구소의 호리 다카아키(堀貴明) 연구원은 “사전에 학습한 언어라면 (한사람이든 여러 사람이든) 도중에 언어를 바꾸거나 다른 사람이 다른 언어로 말을 하더라도 각자가 하는 이야기를 정확하게 인식하게 할 수 있다”고 설명했다.
전지연기자 now21@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.