<이미지를 클릭하시면 크게 보실 수 있습니다> |
정부가 주로 사용하는 문서 형식은 한글문서(.hwp, .hwpx)로 작성되면 텍스트 정보 외에도 다양한 서식 데이터가 가미돼 있다. AI 학습을 위해서는 한차례 변환 과정을 더 거쳐야 하는 불편함이 있다.
국가AI전략위는 이같은 문제를 감안해 향후 한글문서가 아니라 데이터 학습이 용이한 ‘마크다운’ 형식으로 문서를 작성·축적하는 체계를 구축하기로 했다. 당장은 국가AI전략위 내부 문서 작성에 적용하지만 향후 정부 부처 전체 문서작성 체계 전체를 혁신하는 출발점으로 삼겠다는 취지다.
5일 국가AI전략위는 향후 내부 분과별 회의 및 토론 결과를 인공지능 친화 텍스트 형식인 마크다운으로 작성·관리하고 이를 국가AI전략위 공식 홈페이지에 공개할 계획이라고 밝혔다. 마크다운은 복잡한 서식 없이 제목·문단·목차 등 문서 구조를 단순한 기호로 표현해 사람과 AI가 함께 읽기 쉬운 문서 작성 방식이다.
이번 조치는 정부와 공공기관에서 관행적으로 사용해 온 한글 문서가 사람이 눈으로 보는 시각적 표현을 높이는 데 초점을 두고 작성돼 AI 학습과 활용에는 불편하다는 문제의식에 따른 것이라는 게 위원회 설명이다. 기존 한글 문서는 글꼴·자간·기호표 등 다양한 편집이 적용돼 있다. AI가 문장과 문단 구조를 정확히 인식하는 데 어려움이 있다는 지적이 제기돼 왔다.
위원회는 회의 및 토론 결과 문서가 공적 의사결정이 축적된 고품질 데이터로서 AI 한국어 이해 능력을 높이는 데 중요한 자산이라는 점에 주목했다. 이에 따라 기존 문서 작성 체계를 AI 활용에 적합한 형식으로 전환할 필요가 있다고 판단했다.
특히 마크다운 형식은 국제적으로 널리 사용되는 문서 형식으로 AI 학습 등에 주로 활용하고 있다. 이번 전환을 통해 축적되는 정책 데이터를 기업들이 AI 모델 개발과 서비스 혁신에 직접 활용할 수 있도록 지원한다.
임문영 부위원장은 “AI 시대에는 정책 내용뿐 아니라 정책이 축적 관리되는 방식을 혁신하는 것 자체가 중요하다”며 “이번 문서 체계 전환은 정부가 AI를 활용하는 방식과 일하는 문화를 바꾸는 출발점이 될 것”이라고 말했다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
