미쓰비시전기 시연회서 공개, 5개국어는 90% 이상 인식
기존 음성인식기술은 특정 언어만 인식했지만 새로 개발된 기술을 이용하면 국제공항 등 여러 나라 말이 뒤섞여 오가는 장소에서도 활용이 가능할 것으로 기대된다.
아사히(朝日)신문에 따르면 미쓰비시(三菱)전기는 19일 이런 기술을 적용한 공항로비 안내판을 이용한 시연회를 언론에 공개했다. 시연회에서는 두 사람이 안내판을 향해 동시에 영어로 '목걸이를 사고 싶다', 일본어로 '중국요리가 먹고 싶다'고 말하자 영어로 보석가게의 위치와 중국식당의 위치가 동시에 표시됐다. 이 기술을 적용하면 발음사전 등 언어별 전문지식이 필요없다고 한다.
음성인식 이미지 |
인공지능(AI) 기술의 하나로 신경회로를 모방한 '뉴럴 네트워크'를 적용한 '심층학습'을 이용했다. 음성과 문자열의 시간적 관계를 추정하는 방법과 문자열의 소리와 문장의 연결을 중시해 추정하는 방법을 종합했다고 한다.
복수의 언어를 학습하도록 해 음성인식률은 일본어, 영어, 프랑스어, 독일어, 이탈리아어 등 5개 언어의 경우 90% 이상, 중국어와 스페인어, 포르투갈어, 러시아어, 네덜란드어를 합한 10개 언어의 인식률은 80% 이상이다.
인터넷 등에 접속하지 않고 게임용 PC나 소형 컴퓨터만으로도 이용할 수 있다. 복수의 언어로 대화하는 영상대화를 문자로 바꾸는 용도 등에 이용할 수 있을 것으로 보인다. 앞으로 잡음 등 소음이 심한 환경에서 어느 정도 인식이 가능한지 등 실용성을 확인하는 시험을 거쳐 실용화한다는 계획이다.
이 회사 연구소의 호리 다카아키(堀貴明) 연구원은 "사전에 학습한 언어라면 (한사람이든 여러 사람이든) 도중에 언어를 바꾸거나 다른 사람이 다른 언어로 말을 하더라도 각자가 하는 이야기를 정확하게 인식하게 할 수 있다"고 설명했다.
lhy5018@yna.co.kr
<저작권자(c) 연합뉴스, 무단 전재-재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.