<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] JP모건이 'DocLLM: 멀티모달 문서 이해를 위한 레이아웃 인식 생성언어 모델'이라는 제목의 논문을 발표했다.
12일 일본 IT미디어에 따르면 이 논문은 송장, 영수증, 계약서, 구매 주문서, 양식 등 복잡한 레이아웃, 템플릿, 형식의 문서를 자동으로 분석하는 대규모언어모델(LLM) '도큐먼트AI'(DocAI)를 제안하고 있다.
도큐먼트AI는 공간 레이아웃과 텍스트 이해를 모두 모델링한다. 기존의 LLM을 기반으로 하며 문서 분석에 특화된 데이터 세트로 미세 조정된다는 설명이다. 또 처리 시간을 단축하고 불완전한 정보에서 의미를 추론하는 기능을 향상시켰다.
평가 실험 결과, 도큐먼트AI는 양식 이해, 테이블 정렬 및 시각적 질문 답변과 같은 문서 구문 분석 작업에서 높은 수행능력을 보였다고 한다.
아울러 도큐먼트AI는 정보 추출, 분류, 질의응답 등 다양한 작업에서 큰 발전을 이뤘으나 정확성, 신뢰성, 문맥 이해, 일반화와 같은 영역에서는 여전히 성능 격차를 지닌다고 한다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.