<이미지를 클릭하시면 크게 보실 수 있습니다> |
AI 테크 기업 크라우드웍스가 과학기술정보통신부의 '독자 AI 파운데이션 모델(독파모) 개발 사업' 추가 공모에서 최종 선정된 모티프테크놀로지스 컨소시엄에 데이터 공급 핵심 파트너로 참여한다.
크라우드웍스는 이번 사업에서 모티프 컨소시엄이 추진하는 3,000억(300B) 파라미터급 추론형 거대언어모델(LLM) 개발에 필요한 고품질 학습 데이터 공급을 맡는다. 단순 데이터 가공을 넘어 모델의 단계별 사고 능력을 극대화하기 위한 '단계별 추론(Chain-of-Thought) 특화 학습 데이터셋' 구축에 집중한다.
핵심 수단은 자체 개발한 비정형 문서 데이터 전처리 솔루션 '알피 날리지 컴파일러(Alpy Knowledge Compiler)'다. 표·차트 등 복잡한 구조의 비정형 문서를 정교하게 파싱해 AI가 이해할 수 있는 형태로 변환하는 기술로, 추론형 모델이 전문 지식을 안정적으로 학습하는 데 활용된다.
크라우드웍스는 이번 합류 이전부터 국가대표 AI 정예팀에 고품질 학습 데이터를 공급해왔다. 지난해 하반기에는 저작권 문제를 해결한 도서 데이터를 제공했으며, 한국 사회의 언어적·문화적 맥락을 반영한 '방송영상 이해 데이터셋' 구축도 완료했다. 크라우드웍스는 LG AI연구원, SK텔레콤, 업스테이지 컨소시엄과 함께 4대 정예팀의 일원으로 활동하게 됐다.
글 : 플래텀(editor@platum.kr)
ⓒ '스타트업 전문 미디어 & 중화권 전문 네트워크' 플래텀, 조건부 전재 및 재배포 허용
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
