컨텐츠 바로가기

07.02 (화)

기계번역 한계 넘을 ‘범용 문장구조 모델’ 가능할까

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
한겨레

국내 민간 연구자가 현재 인공지능(AI) 기계번역의 한계를 극복할 수 있는 방법의 하나로 ‘범용 문장구조 모델’을 제시했다. 픽사베이

<이미지를 클릭하시면 크게 보실 수 있습니다>


국내 민간 연구자가 현재 인공지능(AI) 기계번역의 한계를 극복할 수 있는 방법의 하나로 ‘범용 문장구조 모델’을 제시했다. 범용 문장구조 모델이란 모든 언어를 관통해 적용할 수 있는 모델을 말한다.



김민구 디코드 대표가 개발한 이 모델은 모든 언어의 기본 뼈대를 이루는 주어(S), 목적어(O), 서술어(V)를 원 형태로 연결한 것이다. 김 대표는 “이 3가지 요소를 조합하면 6가지(SOV, SVO, OVS, VOS, VSO, OSV) 유형의 문장 구조가 만들어지는데 이를 원 형태로 연결하면 시계 방향과 시계 반대 방향 2가지로 단순화할 수 있다”고 말했다.



그는 “이는 모든 자연언어가 동일한 문법 구조를 지니고 있다는 노엄 촘스키의 보편문법 이론의 신빙성을 입증할 수 있는 언어 구조의 원리”라며 “실제로 한국어와 영어뿐만 아니라 일본어, 우즈베크어, 웨일스어 등 자연언어를 이 모델로 설명할 수 있었다”고 강조했다.



김 대표는 이를 ‘시내퍼 모델’(synapper model)로 명명하고 “이 개념을 더 발전시켜 여러 차원으로 연결시키면 시내퍼 모델이 완성된다”고 말했다.



그에 따르면 예컨대 “Jane has a very fast brown horse”라는 문장에서 주어 ‘Jane’으로 시작해 시계 방향으로 이동하면 영어 문장이 완성되고, 반대로 주어에서 시계 반대 방향으로 단어를 읽으면 한국어나 일본어 어순에 맞는 문장이 출력된다. 즉 시내퍼 모델을 이용하면 이 영어 문장이 “제인은 매우 빠른 갈색 말을 가졌다”는 한국어 문장이나 “ジェーンはとても早い茶色の馬を持っている”라는 일본어 문장이 된다는 것이다.



한겨레

<이미지를 클릭하시면 크게 보실 수 있습니다>


김 대표는 조금 더 긴 문장을 구글 번역, 마이크로소프트의 빙, 네이버 파파고, 딥엘(DeepL) 등 기계번역 프로그램으로 번역한 결과와 ‘시내퍼 모델’을 적용해 번역한 것을 전문 번역가한테 ‘블라인드’ 평가받은 결과 시내퍼 모델 번역이 더 높은 점수를 받았다고 주장했다.



김 대표는 “아직 가설이지만 이는 시내퍼 모델이 인간 뇌에서 처리하는 방식이라고 예측되는 과정과 흡사한 방법으로 문장 구조를 처리하기 때문일 것으로 본다”고 말했다. 그는 “기계번역 알고리즘은 문장을 여러 조각으로 나누어 통계적 계산을 가지고 결과물을 추측해 생성하기 때문에 매번 정확한 결과를 가져오기는 거의 불가능하지만 시내퍼 모델은 원문을 보존하면서 번역문을 원본에서 추출해 내기 때문에 이론적으로는 어떤 문장도 정확한 번역이 가능해진다”고 주장했다.



김 대표는 지난해 한국정보과학회(KCC) 학술대회에서 시내퍼 모델을 발표한 데 이어 올해 2월 사전출판 논문 공유집 ‘아카이브’(Arxiv.org)에 논문을 게재했다.



*논문 정보



https://arxiv.org/html/2402.01641v1



Universal Syntactic Structures: Modeling Syntax for Various Natural Languages.



곽노필 선임기자 nopil@hani.co.kr



▶▶권력에 타협하지 않는 언론, 한겨레 [후원하기]
▶▶한겨레 뉴스레터 모아보기


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.