한컴오피스, AI플랫폼 전환 전략
한글과컴퓨터는 35년간 축적된 아래아한글 문서가 ‘소버린AI’ 경쟁력을 강화하는 핵심 데이터가 될 수 있다고 강조했다. [한컴 제공] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
인공지능(AI) 시대, 특화된 고유 데이터의 중요성이 커지면서 한글과컴퓨터(한컴)의 ‘아래아한글(HWP)’이 새로운 전략자산으로 재조명받고 있다. 35년간 축적된 아래아한글 문서가 AI 데이터 주권을 확보할 수 있는 핵심 기반이 될 수 있다는 기대다.
27일 한컴은 AI 시대를 대비해 문서의 구조 정보를 명확히 담을 수 있는 XML 기반의 개방형 표준 포맷 HWPX로 전환을 추진중이라고 밝혔다.
과거 HWP 파일이 이진(Binary) 코드로 구성돼 기계 판독이 어려웠던 한계를 기술적으로 해결한 것이다. HWPX는 문서 내의 텍스트, 표, 수식 등을 컴퓨터가 명확하게 식별할 수 있는 구조로 저장한다.
한컴에 따르면 정부의 실증 테스트를 통해 HWPX의 데이터 추출 정확도가 마이크로소프트(MS)의 DOCX 등 국제 표준과 비교해 유의미한 차이가 없음을 검증했다.
한컴은 한컴 데이터 로더(Data Loader) 기술을 통해 문서 활용성을 높였다. 이 기술은 HWP 문서를 AI가 학습하기 쉬운 데이터 형태(JSON 등)로 자동 변환해 준다. 별도의 복잡한 가공 과정 없이도 기존 문서를 AI 학습용 데이터로 즉시 활용할 수 있는 기반이 마련됐다.
디지털 시대의 기술 주권을 위해서는 국내 환경에 최적화된 데이터를 전략적으로 활용해야 한다는 목소리도 커지고 있다. 정지환 한컴 최고기술책임자(CTO)는 “한글 문서는 단순한 기록물이 아니라, 국내 AI 산업이 글로벌 빅테크와 차별화된 경쟁력을 갖게 하는 원천”이라고 말했다.
박세정 기자
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
