레벨4 자율주행 구현 위한 정부 국책과제 수행
ETRI 공공포털에 데이터셋 공개…신뢰성 검증
"시간·비용 절감…국내 맞춤형 R&D 활성화 기대"
카카오모빌리티 ‘인공지능(AI) 학습용 자율주행 데이터셋’.(사진=카카오모빌리티) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
AI 학습용 자율주행 데이터셋은 자율주행기술개발혁신사업단(KADIF)의 ‘자율주행 기술개발 혁신사업’ 국책 과제 일환으로 구축한 사업이다.
카카오모빌리티는 레벨4(고도) 자율주행 구현을 위한 해당 사업에 참여해 △차량 △엣지-인프라 △지능 학습을 연계해 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술 개발을 완료했다.
사업의 일환으로 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개하고, 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 한다는 취지다.
그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려웠다. 또 이미 공개된 데이터셋은 대부분 해외 지역이나 특정 시간대에 수집된 데이터로 국내 실정에 맞는 연구·개발에 한계가 있었다.
카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했다.
이는 사람·차량·자전거 등 움직이는 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지·판단할 수 있는 10개 유형의 15만건으로 구성된 데이터셋으로, 국내 환경에 적합한 자율주행 AI 모델 개발과 학습에 활용할 수 있을 것으로 보고 있다.
특히 해당 데이터는 △도로타입(고속도로·국도·지하차도·터널 등) △시간(주·야간) △날씨(맑음·강우·안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집했다. 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람과 사물 등 개체 속성을 구분할 수 있는 세분화(Pointcloud segmentation) 데이터도 포함해 활용 가치가 높을 것으로 보인다.
ETRI가 자율주행 차량에 해당 데이터셋을 학습해 실증한 결과, 사람과 차량··자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 나타났다.
특히 도심지 야간 교통 정체 상황, 보행자 신호등과 같은 희소 데이터에 대한 AI 성능이 크게 향상됐다. 자율주행 AI의 객체 검출 및 인식 성능이 향상되면, 주변 환경을 보다 정확히 인식해 안정적인 자율주행이 가능하다.
장성욱 카카오모빌리티 미래이동연구소장은 “이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다”며 “앞으로도 다양한 공공 및 민간 기업과 협력해 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장설 것”이라고 밝혔다.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
