컨텐츠 바로가기

    03.17 (화)

    미소정보기술, 3세대 OCR '빅스' 출시… “VLM기반 이미지·문서 분석”

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털데일리 구아현기자] 멀티모달 데이터 플랫폼 전문기업 미소정보기술이 비전언어모델(VLM) 기반 3세대 광학 문자 인식(OCR) ‘ViiX(빅스)’를 출시한다고 17일 밝혔다.

    빅스는 의료, 제조, 건설 문서 등 산업 현장에서 생성된 문서를 대형언어모델(LLM)을 통해 이해하고 데이터로 변환하는 도메인 특화 OCR 솔루션이다. 문서 레이아웃, 서체, 공간적 구조, 문맥 등을 분석하는 기술을 적용했다. 단순 텍스트 인식을 넘어 문서를 데이터로 구조화하고 검색, 분석, 업무 자동화까지 연결해 AI 기반 문서 처리 환경을 제공한다.

    기존 1세대 OCR은 문자 인식 중심, 2세대 OCR은 딥러닝 기반 표 영역 인식 및 필드 추출 등을 지원했다. 3세대 OCR 빅스는 문서의 문맥과 구조를 함께 분석하는 방식으로 정확도를 높였다.

    제로샷(Zero-Shot) 기반 문서 이해 기술을 적용해 별도의 라벨링 없이도 다양한 문서 양식에 대응할 수 있도록 개발됐다. 이를 통해 작업지시서, 진료기록, 보험청구서, 계약서 등 문서 처리 자동화를 지원한다.

    또 휴먼 인 더 루프(Human in The Loop) 기반 학습 구조를 적용해 AI가 확신하지 못하는 데이터만 선별적으로 검수 요청을 수행한다.

    미소정보기술은 여기에 20년간 의료·제조·건설 산업 현장에서 축적한 도메인 데이터를 기반으로 전문 학습 레이어를 적용한 도메인 특화 AI 모델을 구축했다. 자체 개발한 자연어 처리(NLP) 기술 ‘Smart TA(Text Analysis)’와 AI 모델 개발 및 운영 자동화 플랫폼 ‘액틱(ACTIC)’을 연계해 문서 인식 이후 데이터 분석 및 업무 자동화까지 확장 가능한 구조를 제공한다.

    남상도 미소정보기술 대표이사는 “문서를 단순히 읽는 수준을 넘어 문서에 담긴 비즈니스 맥락을 이해하고 현장에서 업무 자동화를 구현하겠다”고 말했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.