바이오 경로 이미지에서 생화학 반응 정보를 자동으로 추출하는 EBPI 모식도 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
유전자, 단백질, 대사물질 등 복잡한 정보를 표현하는 바이오 경로 이미지는 중요한 연구 결과를 내포하지만, 이미지 기반 정보 추출에 대해서는 그동안 충분한 연구가 이뤄지지 않았다.
이에 한국과학기술원(KAIST·총장 이광형) 연구진이 바이오 경로 정보를 자동으로 추출할 수 있는 인공지능(AI) 프레임워크를 개발했다.
KAIST는 김현욱 생명화학공학과 교수팀이 바이오 경로 이미지에서 유전자와 대사물질 정보를 자동 추출하는 기계학습 기반 '바이오 경로 정보 추출 프레임워크(EBPI)'를 개발했다고 28일 밝혔다.
EBPI는 문헌에서 추출한 이미지 속 화살표와 텍스트를 인식하고, 이를 기반으로 바이오 경로를 편집 가능한 표의 형태로 재구성한다.
객체 감지 모델 등 기계학습을 사용해 경로 이미지 내 화살표 위치·방향을 감지하고, 이미지 속 텍스트를 유전자, 단백질, 대사물질로 분류한다. 그 후 추출된 정보를 통합해 경로 정보를 표 형식으로 제공한다.
연구팀은 7만4853편 논문에서 추출한 바이오 경로 이미지와 기존 수작업으로 작성된 경로 지도를 비교하며 EBPI의 성능을 검증했다. 그 결과, 높은 정확도로 바이오 경로 정보가 자동으로 추출됐음을 확인했다.
EBPI를 사용해 대표적인 바이오 경로 데이터베이스에 포함되지 않은 생화학 반응 정보를 대량의 문헌 내 바이오 경로 이미지로부터 추출하는 데에도 성공했다.
김현욱 교수는 “이번 연구에서 개발된 EBPI는 대규모 문헌 데이터 분석에 있어 중요한 도구가 될 것이며 생명공학, 대사공학 및 합성생물학 분야에서 바이오 경로 이미지를 AI로 분석하는 최초의 사례”라며 “관련 연구 실험 디자인 및 분석 시 유용하게 활용될 수 있을 것”이라고 밝혔다.
KAIST 생명화학공학과의 권문수 박사과정생과 이준규 박사과정생이 공동 제1 저자인 이번 연구는 국제학술지 대사공학(Metabolic Engineering, JCR 분야 상위 10% 이내)에 11월호에 게재됐다.
한편 이번 연구는 과학기술정보통신부 한국연구재단 및 농촌진흥청의 농업미생물사업단의 지원을 받아 수행됐다.
김영준 기자 kyj85@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.