ETRI, 한국어 언어 모델 ‘AI 코버트’ 공개

동아일보 원문
입력

2019.06.12 03:00

최종수정

2019.06.12 03:30

주소복사가 완료되었습니다

사람이 하는 말을 정확히 이해하고 적절한 대답을 찾도록 돕는 인공지능(AI)용 한국어 데이터베이스(언어모델)가 나왔다. 기존에 존재하던 구글의 한국어 모델보다 질의응답, 문장 내 개체 역할 인식 등 성능이 뛰어난 것으로 평가됐다.

한국전자통신연구원(ETRI)은 AI 서비스 개발을 위해 독자적으로 구축한 한국어 특화 딥러닝 언어모델 ‘코버트(KorBERT)’를 10일 홈페이지를 통해 공개했다고 11일 밝혔다. 언어모델은 AI가 언어를 학습할 수 있도록 구축한 일종의 데이터베이스다. 언어를 숫자로 표현한 뒤 AI 기술의 일종인 딥러닝을 이용해 학습한다. 이 과정에서 어떤 단어가 특정 조건에서 얼마나 많이, 자주 나타나는지를 확률로 계산해 언어와 함께 모았다. ETRI의 코버트는 최근 10년간의 신문기사와 백과사전 데이터를 추가로 학습시켜 학습량을 늘린 게 특징이다.

윤신영 동아사이언스 기자 ashilla@donga.com

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

05.24 (금)

ETRI, 한국어 언어 모델 ‘AI 코버트’ 공개

동아일보 주요 뉴스