21일(현지시간) 온라인 매체 기가진에 따르면, 퍼치 2.0은 1만4500종 이상의 생물 데이터를 학습한 모델이지만, 수중 음향 데이터는 거의 포함되지 않았다. 그러나 소량의 레이블 데이터로 전이 학습을 수행한 결과, 해양 포유류 분류에서 기존 해양 생물 탐지 모델을 능가하는 성능을 보이는 것으로 나타났다
연구팀은 관련 실험에서 퍼치 2.0이 해양 포유류 및 수중 음향 분류 작업에 전이 학습될 수 있는지 평가했다. 실험에 사용된 데이터 세트는 주로 3가지로 구성되어 있다. 첫 번째는 'NOAA PIPAN'으로, 밍크고래, 혹등고래, 정어리고래, 흰긴수염고래, 긴수염고래 등 수염고래류의 울음소리와 인위적인 노이즈를 포함한 30초 분량의 녹음 데이터다. 두 번째는 'ReefSet'으로, 산호초 생물 유래 소리와 특정 어류, 돌고래, 파도 소리 등을 포함한 데이터 세트다. 세 번째는 'DCLDE 2026'으로, 북동 태평양의 혹등고래와 혹등고래, 비생물적인 소리 등을 구분하는 과제가 설정되어 있다.
실험 결과, 퍼치 2.0은 대부분의 해양 생물 탐지 작업에서 일관되게 높은 정확도를 기록했으며, 특히 범고래 아종 식별에서 다른 모델보다 뚜렷한 성과를 보였다.
구글은 대규모 모델의 일반화 능력이 이러한 성과의 핵심이라고 분석했다. 새소리는 종 간 차이가 미세하지만, 퍼치 2.0은 이를 구분하기 위해 정교한 음향 특징을 학습했다. 이러한 능력이 고래와 같은 해양 생물의 소리 분석에도 적용된 것이다.
현재 NOAA 데이터 기반 고래 탐지 튜토리얼도 공개되며, AI가 해양 생태계 연구와 보존 활동에서 중요한 도구로 자리 잡고 있다. 이 기술은 고래의 새로운 소리나 환경 변화를 실시간으로 탐지하는 데도 활용될 전망이다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
