컨텐츠 바로가기

    12.06 (토)

    이슈 미래 모빌리티 생태계

    카카오모빌리티, '자율주행 AI 학습용 데이터셋' 공개

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다

    레벨4 자율주행 구현 위한 정부 국책과제 수행

    ETRI 공공포털에 데이터셋 공개…신뢰성 검증

    "시간·비용 절감…국내 맞춤형 R&D 활성화 기대"

    [이데일리 김범준 기자] 카카오모빌리티는 과학기술정보통신부와 ‘인공지능(AI) 학습용 자율주행 데이터셋’을 한국전자통신연구원(ETRI) ‘AI 나눔’에 공개해 국내 자율주행 연구개발 생태계 조성에 나선다고 28일 밝혔다.

    이데일리

    카카오모빌리티 ‘인공지능(AI) 학습용 자율주행 데이터셋’.(사진=카카오모빌리티)

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    AI 학습용 자율주행 데이터셋은 자율주행기술개발혁신사업단(KADIF)의 ‘자율주행 기술개발 혁신사업’ 국책 과제 일환으로 구축한 사업이다.

    카카오모빌리티는 레벨4(고도) 자율주행 구현을 위한 해당 사업에 참여해 △차량 △엣지-인프라 △지능 학습을 연계해 융합형 자율주행 데이터의 생성·관리·배포 자동화 기술 개발을 완료했다.

    사업의 일환으로 국내 도로 환경에서 구축한 비식별화된 AI 학습용 데이터셋을 일반에 공개하고, 저작권 문제없이 누구나 자유롭게 자율주행 연구개발에 활용할 수 있도록 한다는 취지다.

    그동안 자율주행을 연구하는 소규모 기업이나 학계, 연구계에서는 막대한 비용과 시간이 소요돼 라이다·레이더·카메라 센서로 자율주행 데이터를 직접 확보하기 어려웠다. 또 이미 공개된 데이터셋은 대부분 해외 지역이나 특정 시간대에 수집된 데이터로 국내 실정에 맞는 연구·개발에 한계가 있었다.

    카카오모빌리티가 이번에 공개한 데이터셋은 국내 주요 도로변에 설치된 라이다·카메라 센서 등 엣지-인프라와 카카오모빌리티가 직접 운영한 자율주행차를 통해 획득했다.

    이는 사람·차량·자전거 등 움직이는 3D 동적 객체와 신호등, 표지판 등 2D 정적 객체를 인지·판단할 수 있는 10개 유형의 15만건으로 구성된 데이터셋으로, 국내 환경에 적합한 자율주행 AI 모델 개발과 학습에 활용할 수 있을 것으로 보고 있다.

    특히 해당 데이터는 △도로타입(고속도로·국도·지하차도·터널 등) △시간(주·야간) △날씨(맑음·강우·안개 등) 등 총 31개 카테고리의 다양한 환경 조건에서 수집했다. 라이다 센서를 통해 취득한 포인트클라우드의 좌표값은 물론 사람과 사물 등 개체 속성을 구분할 수 있는 세분화(Pointcloud segmentation) 데이터도 포함해 활용 가치가 높을 것으로 보인다.

    ETRI가 자율주행 차량에 해당 데이터셋을 학습해 실증한 결과, 사람과 차량··자전거 등 3D 동적 객체 검출 AI 성능은 약 5~8%, 신호등 인식 AI 성능은 약 2%가 향상된 것으로 나타났다.

    특히 도심지 야간 교통 정체 상황, 보행자 신호등과 같은 희소 데이터에 대한 AI 성능이 크게 향상됐다. 자율주행 AI의 객체 검출 및 인식 성능이 향상되면, 주변 환경을 보다 정확히 인식해 안정적인 자율주행이 가능하다.

    장성욱 카카오모빌리티 미래이동연구소장은 “이번 데이터셋 공개가 국내 자율주행 기술의 상용화와 발전을 앞당기는 초석이 되길 기대한다”며 “앞으로도 다양한 공공 및 민간 기업과 협력해 자율주행 기술 혁신과 공공 데이터 활용 확대에 앞장설 것”이라고 밝혔다.


    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.