CORE:ALAP은 데이터 수집과 전처리 과정에서 가장 중요한 '레이블링(Labeling)' 기술을 부각하면서 AI 학습 데이터 정제 역량을 강화한다는 의미를 담았다. 데이터 레이블링이란 AI학습을 위해 대량의 데이터를 분석해 각 데이터에 정답이나 의미 있는 정보를 부여하고 이를 표준화하는 작업이다. 특히 의료 분야에서는 레이블 데이터가 환자 안전과 의료적 신뢰성을 보장하는 데 필수적이다.
CORE:ALAP은 양질의 레이블링 데이터셋을 장기간 축적하고 의료 현장에서 제품 상용화까지 됐다는 점에서 차별화된 경쟁력을 가지고 있다. 코어라인소프트는 의료 분야에 적용되는 다양한 AI 소프트웨어(SW)를 공급하면서 약 3700만건의 데이터셋을 축적해 AI 엔진 구현에 적용했다. 학습 데이터 중 코어라인소프트가 독점적으로 보유하고 있는 비공개 데이터셋 비율은 80%에 달한다.
코어라인소프트 로고.[사진=코어라인소프트] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
의료 분야에 적용되는 AI 학습용 데이터는 확보 난이도가 높고 원천 데이터가 복잡하기 때문에 데이터의 양뿐 아니라 품질이 제품 성능에 중요한 지표로 꼽힌다. 코어라인소프트는 국내외 최고 수준의 의료진과의 협업과 레이블링에 최적화된 자체개발 3D작업 도구(Tool)를 통해 해당 분야의 AI 정확도와 신뢰도를 세계적인 수준으로 높였다.
코어라인소프트는 고품질 데이터 확보를 위해 자체 개발 프레임워크를 기반으로 레이블링 프로세스를 자동화했다. 프레임워크에 클라우드 기술도 적용해 AI 학습용 데이터를 효율적 관리를 통한 대규모 영상 데이터 기반 다수의 AI SW 구현에 성공했으며, KLUCAS(대한민국 폐암검진사업)을 통해 제품성과 기술력을 인정받았다.
이재연 코어라인소프트 최고기술책임자(CTO)는 "레이블링을 자동화해 고품질의 AI 학습용 데이터를 신속하게 확보할 수 있는 것이 코어라인소프트의 핵심 기술 경쟁력으로, 이를 고도화하기 위해 CORE:ALAP을 론칭했다"며 "보유 기술력을 바탕으로 AI의 성능을 강화하고 전체 밸류체인을 통합해 나갈 것"이라고 전했다.
그는 이어 "원천 데이터의 특성상 의료 분야에 적용되는 AI 학습용 데이터의 수집 및 정제가 다른 산업보다 난이도가 높기 때문에 다른 산업으로의 확장도 용이할 것"이라며 "국내 및 글로벌 공급 레퍼런스를 기반으로 영상 데이터 기반 AI 분야 선도 기업으로 도약해 나가겠다"고 덧붙였다.
nylee54@newspim.com
저작권자(c) 글로벌리더의 지름길 종합뉴스통신사 뉴스핌(Newspim), 무단 전재-재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.