서울대병원과 네이버 공동 연구팀이 건강검진 데이터를 기반으로 개인의 '생물학적 나이'와 건강 위험도를 동시에 평가할 수 있는 인공지능(AI) 모델을 개발했다고 7일 밝혔다.
트랜스포머 기반 딥러닝 구조를 적용해 15만명 이상의 건강검진 및 질병·사망 데이터를 함께 학습시킨 결과, 기존 모델보다 건강 상태 구분과 생존 위험 예측의 정확도를 크게 높였다.
생물학적 나이는 유전, 생활습관, 환경, 질병 이력 등을 종합해 신체의 실제 노화 정도를 수치화한 지표다. 실제 나이보다 생물학적 나이가 낮으면 건강 상태가 양호함을, 반대로 높으면 노화가 빠르거나 질병 위험이 높은 상태를 의미한다. 그러나 기존 모델은 건강인 데이터를 중심으로 구축돼 만성질환자나 사망 위험 반영에는 한계가 있었다.
이번 연구는 서울대병원 내분비대사내과 조영민·배재현·윤지완 교수팀과 네이버 디지털 헬스케어 랩 유한주·문성은 박사팀이 공동으로 수행했다. 연구진은 2003년부터 2020년까지 서울대병원 강남센터에서 건강검진을 받은 15만1281명의 데이터를 분석했다. 데이터에는 신체계측, 혈액·소변검사, 폐기능, 질병 유무 및 사망 정보가 포함됐다.
연구팀은 혈당·혈압·콜레스테롤 수치에 따라 △정상군 △질환 전단계군 △질환군으로 분류한 뒤, 각 집단의 데이터를 트랜스포머 구조의 AI 모델에 학습시켰다. AI는 혈압, 혈당, 폐기능, 지질 등 건강지표를 종합 분석해 개인의 생물학적 나이(BA)를 산출하고, 이를 실제 나이(CA)와 비교해 두 값의 차이(BA-CA)를 계산한다. 이 차이를 통해 AI는 사용자의 건강 상태가 과거 생존율이 높았던 집단과 사망 위험이 높았던 집단 중 어느 쪽과 유사한지를 예측한다.
연구팀은 남녀의 생리적 차이를 반영하기 위해 성별별 모델을 각각 학습시켰다. 단순한 나이 예측을 넘어, 건강지표 변화가 질병 발생과 생존율에 어떤 영향을 미치는지를 함께 평가할 수 있도록 설계했다.
분석 결과, 새로 개발된 모델은 정상군-질환 전단계군-질환군을 명확히 구분했다. 정상군은 생물학적 나이가 실제 나이보다 낮게(BA〈CA), 질환군은 반대로 높게(BA〉CA) 나타났다. 혈당·혈압·지질 수치가 악화될수록 BA-CA 갭이 커졌으며, 심혈관질환이나 암 환자에서도 이 격차가 유의하게 증가했다.
반면 기존 생물학적 나이 모델은 이런 차이를 일관되게 구별하지 못했다.
조영민 서울대병원 내분비대사내과 교수는 “이번 연구는 질병 유병 상태와 사망 정보를 동시에 학습한 최초의 트랜스포머 기반 생물학적 나이 예측 모델이라는 점에서 의미가 크다”며 “AI가 단순히 생물학적 나이를 계산하는 것을 넘어, 개인의 건강 상태와 미래 위험을 함께 반영할 수 있는 새로운 임상 도구로 발전했다”고 말했다.
이어 “서울대병원의 대규모 임상 데이터와 네이버의 첨단 AI 기술력이 결합해, 의료 전문성과 기술이 함께 만든 산학 협력의 대표적 성과”라고 덧붙였다.
이번 연구 결과는 국제학술지 Journal of Medical Internet Research 최근호에 게재됐다.
송혜영 기자 hybrid@etnews.com
[Copyright © 전자신문. 무단전재-재배포금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
