AI, 딥러닝 기법으로 신약 개발 비용·시간·인력 대폭 줄여
고비용-고수익 제약산업 패러다임 흔들려
다국적 거대 자본 독주 체제 → AI 스타트업 진입 여지 생겨
학문간 융합-단백질 구조 예측-데이터 축적 등 과제 남아
자료사진. 기사와 관련이 없음. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[아시아경제 김봉수 기자] 4차 산업혁명의 가장 대표적인 기술인 인공지능(AI)이 신약 개발의 패러다임을 바꾸고 있다. 엄청난 자본·시간을 투자해도 성공 확률이 낮아 대표적 고위험 고수익 분야였던 제약 산업을 소규모 AI 스타트업들이 주도할 수 있는 세상이 됐다.
◇전통적 신약 개발 평균 15년 소요
정명희·권원현 안양대 교수가 지난해 12월 한국정보통신학회논문지(JKIICE)에 공동 발표한 논문에 따르면, 신약 개발은 크게 질병에 대한 타깃 단백질 발굴, 히트(hit) 및 선도(lead) 물질 발굴, 합성 가능성 및 효능, 독성 등에 대한 평가(Scoring) 등의 단계를 거쳐 최적의 후보물질을 발굴하고 마지막으로 전임상, 임상을 수행한다. 특정 약물이 해당 질병에 효과가 기준치 이상으로 있는지, 부작용이나 독성은 없는지 철저한 검증을 거치기 위해서다.
이에 따라 전통적인 신약 개발은 평균 약 15년이 걸리는 게 보통이고 성공 확률도 매우 낮다. 한국보건산업진흥원에 따르면, 약 5000~1만개 가운데 1개만이 최종 성공한다. 구체적으로 약물 발견, 즉 전임상시험에 들어가는 물질 10~250개를 선정하는 데만 평균 5년이 걸린다. 이후 약물 개발, 즉 임상시험에 들어갈 물질을 약 10개 정도로 추리는데 추가로 평균 2년이 소요되고, 의미 있는 물질 1개를 찾기 위한 1상·2상·3상 시험에 또 평균 6년이 걸린다. 여기에 미국 식품의약청(FDA)으로부터 신약 판매 허가를 받는 데 평균 약 2년을 또 기다려야 한다. 글로벌 표준인 미국의 경우 총 14~16년이 걸리고 2조~3조원의 개발비용이 필요하다. 미국 제약사들이 지난 15년간 신약 개발에 투자한 돈은 약 520조원에 달한다. 항공 산업의 5배, 컴퓨터 산업의 2.5배에 달한다. 주로 미국 소재 다국적 대형 제약사들이 독과점 구조를 형성할 수 있는 배경이다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
◇AI로 비용·시간 대폭 줄여
빅데이터를 이용한 AI는 이 같은 신약 개발 과정을 대폭 혁신해 비용·시간을 줄여주고 있다. 신약후보 물질을 발굴할 때 기존에는 정보탐색·약물 설계에 엄청난 시간과 비용이 필요했다. 대상 질병을 정한 후 관련 논문 400~500개를 일일이 살펴보면서 필터링해 후보 물질을 정해야 했다. 특허 자료, 화합물의 구조 및 효능과 관련한 빅데이터, 의료 데이터, 임상 데이터 등 방대한 자료 분석이 필수다. 화합물 활성 및 효능 극대화, 독성·부작용 최소화까지 다양한 요인을 동시에 최적화해야 하는 까다로운 작업이다.
AI는 자동화를 통해 속도는 물론 효율성을 크게 향상할 수 있고, 무작위성·오류 감소, 방대한 자료의 지능적 탐색·패턴 인식이 가능하다. 예컨대 한 번에 100만건 이상의 논문 탐색과 10억개 화합물 탐색이 가능하다. 연구자 수십 명이 최대 5년은 해야 할 일을 하루 만에 끝낸다. 임상시험 단계에서도 마찬가지다. AI가 화합물 구조의 정보와 생체 내 단백질의 결합 능력을 계산해 신약 후보 물질들을 먼저 제시할 수 있다. 병원 진료 기록을 토대로 연구하고 있는 질병과 관련이 높은 임상 대상 환자군을 찾기도 쉬워진다. 유전체 변이와 약물 간의 상호 작용을 예측해 임상 실험 디자인 설계 및 맞춤형 약물의 개발 단계에서 시행착오를 현저히 줄일 수 있다. 오두병 한국연구재단 신약단장은 "현재 약물 후보 물질을 검색하는 데 가장 많이 활용되고 있다"면서 "최근 코로나19 치료제를 발굴하기 위해 AI를 활용한 약물 재창출 기술을 통해 빠른 시간에 후보물질을 찾은 게 대표적인 사례"라고 설명했다.
즉 현재 시중에 판매 중인 약물이 2만종에 달한다. 이를 일일이 임상시험을 통해 특정 질병에 효과가 있는지 검증하기 위해선 많은 재정은 물론 시간이 필요했다. 그러나 AI는 2만개의 약물 중 코로나19에 효과가 있는 후보군을 찾는 데 며칠이면 충분했다. 특히 신약 개발의 가장 큰 난제로 꼽혀 온 단백질 3차원 구조 예측도 최근 AI의 급속한 발달로 혁신적인 단계에 접어들었다. 구글 딥마인드의 단백질 구조 예측 AI 알파폴드2가 지난 7월 말 지구상에 존재하는 2억여개의 단백질 구조를 모두 예측한 데이터베이스(DB)를 공개한 것이 대표적 사례다. 오 단장은 "단백질 구조를 예측할 수 있다면 약물의 효과를 사전에 예상하고 설계할 수 있다"며 "신약 개발의 혁신적인 도구가 될 수 있을 것"이라고 말했다.
한국이 구축한 공공 인공지능 신약개발 플랫폼 KAIDD. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
◇데이터 수집·학문 융합 등 과제
신약 개발의 대표적인 병목 현상은 단백질 기능과 구조를 파악하는 데서 발생해왔다. 단백질은 DNA, RNA와 함께 생명 현상의 핵심 물질이다. 수천 개의 아미노산이 고유한 방식으로 접히면서 입체적인 구조를 형성하는데, 이를 예측·파악할 수 있다면 질병의 원인과 증상, 치료제 개발에 혁신을 가져올 수 있다. 알파폴드2는 딥러닝 기술로 학습한 결과 90% 이상의 확률로 단백질 구조를 정확히 예측하는 성과를 보여주고 있다. 단백질 시퀀스와 다중서열정렬(MSA) 특징을 입력받아 콘볼루션신경망(CNN)을 거쳐 잔기쌍들의 거리(Amino Acid distances)와 비틀림(Chemical bond angles) 분포를 출력한다. 이를 이용해 단백질 구조를 잘 표현할 수 있는 에너지 함수를 만들고, 경사하강법으로 에너지가 최소화할 때까지 반복해서 최적화시키면서 주어진 단백질의 3차원 구조를 예측하는 방식이다.
화학과 생물학 등 학문 간 융합 연구도 절실하다. 정·권 교수는 논문에서 "그동안 화학적 시스템에 대한 이해가 크게 발전하면서 양적 성공을 거둔 것은 확실하지만 신약 발견으로 이어지기 위해선 생물학적 관계에 대한 이해가 반영된 질적 정보와 자료가 필요하다"면서 "AI가 신약 개발·승인의 판도를 바꾸려면 화학과 생물학, 독성학, 약동학 등의 광범위한 전문 분야의 협력과 융합이 더 이뤄져야 한다"고 지적했다.
AI의 정확도·안전성을 높이기 위해선 질적·양적으로 충분한 데이터의 확보도 필요하다. 오 단장은 "AI를 활용한 신약 개발은 미국 등에서 일부 임상에 성공한 사례가 있긴 하지만 이제 검증 중이며 태동기로 보면 된다"면서 "패러다임 전환까지 가려면 양질의 풍부한 데이터를 축적하는 게 중요하다"고 지적했다.
김봉수 기자 bskim@asiae.co.kr
<ⓒ경제를 보는 눈, 세계를 보는 창 아시아경제(www.asiae.co.kr) 무단전재 배포금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.