컨텐츠 바로가기

05.16 (목)

AI 데이터세트 예시 제안하는 ‘인공지능 데이터셋 경진대회’

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
플래텀

인공지능 데이터세트(Dataset) 예시를 제안하는 대회가 개최된다.

<이미지를 클릭하시면 크게 보실 수 있습니다>


셀렉트스타는 ‘2020 인공지능 데이터셋 경진대회‘를 개최한다고 밝혔다. 이번 대회는 중소기업, 스타트업, 연구소, 개인 연구자 등이 활용 가능한 데이터세트 예시를 모집하기 위해 기획된 것이 특징이다.

데이터세트란 차세대 인공지능 학습에 활용할 수 있는 데이터를 수집해 놓은 자료다. 일례로 플레이된 바둑 게임 약 3천만 수를 가져와 정책망 학습 기록을 적용시킨 알파고, 얼굴로 나이·성별 등을 판별하기 위해 수많은 사진 데이터를 적용시킨 AI 솔루션 등이 있다.

이번 대회는 한국에 맞게 구축할 수 있는 데이터세트와 그 활용 예시들을 제안하는 것이 주요 골자다. 개인, 단체로 팀을 꾸려 참여할 수 있다.

대회 참가자는 셀렉트스타 홈페이지에 업로드 된 이미지, 영상, 오디오, 텍스트 수집 및 가공 내용 예시들을 참고할 수 있다. 데이터세트 구축에 필요한 모든 데이터 수집, 가공은 셀렉트스타가 운영하는 캐시미션 앱을 통해 크라우드 소싱 방식으로 진행된다.

무엇보다 크라우드소싱 방식으로 불특정 다수의 대중들을 통해 수집, 가공할 수 있는 데이터를 제안하는 것이 참가 과정의 핵심이다. 독창적인 새로운 데이터세트를 제안하는 방법, 해외에 이미 구축된 데이터세트를 국내 환경에 맞게 새롭게 변모시키는 방법 등 다양한 과정으로 참여할 수 있다. 셀렉트스타는 실용성과 범용성을 주요 심사 기준으로 삼는다는 계획이다.

2월 13일 접수가 마감 되는 가운데 2월 18일 서류심사 및 우수팀 선발이 이뤄질 예정이다.

셀렉트스타 관계자는 “대회를 통해 한국의 AI 발전에 도움이 될 수 있는 데이터세트 구축에 대한 아이디어를 발굴하고 추후 셀렉트스타에서 이를 직접 구축한다는 것이 대회의 본 취지”라고 전했다.

한편, 셀렉트스타는 AI 개발에 필요한 데이터를 모바일 크라우드소싱으로 수집 및 가공하는 서비스 제공에 나서고 있다. 특히 모바일 앱 ‘캐시미션’의 2만여 사용자들이 AI 기업들이 요청한 데이터 수집과 레이블링을 수행하고 보상을 받아가는 시스템이다. 지난 2018년 말 카이스트 창업팀에서 시작된 셀렉트스타는 현재 네이버, LG CNS, 한국전력, 롯데정보통신, 카이스트 등 40여 개의 고객사와 매출 14억 원을 확보하는데 성공했다. 현재 카카오 벤처스의 투자를 받아 빠르게 성장하고 있는 스타트업으로 주목 받고 있다.

글: Platum(editor@platum.kr)

ⓒ '스타트업 전문 미디어 & 중화권 전문 네트워크' 플래텀, 조건부 전재 및 재배포 허용
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.