챗GPT [사진: 셔터스톡] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 영국 케임브리지 대학교 임상의학과의 연구 결과, 오픈AI의 GPT-4가 의료 분야 중 안과 평가에서 전공의 수준의 성능을 보였다고 18일(현지시간) IT매체 엔가젯이 전했다.
연구진은 GPT-4와 GPT-3.5, 구글 팜2(PaLM 2), 메타 라마를 87개의 객관식 질문으로 테스트했다. 더불어 전문의 5명, 일반의 2명, 수습의 3명이 동일한 모의고사를 실시했으며, 해당 문제는 빛에 대한 민감성에서 병변에 이르기까지 의대 교과서를 기반으로 출제됐다.
그 결과, GPT-4는 87개 문항 중 60개를 맞혀 수습의와 일반의보다 높은 점수를 받았다. 수습의의 평균 정답 개수는 59.7개, 일반의는 37개였다. 전문의의 경우 평균 66.4개로 GPT-4를 능가했다. 또한 팜2는 49점, GPT-3.5는 42점을 받았다.
이러한 결과는 인공지능(AI)의 잠재적인 이점을 제시하나 여러가지 위험과 우려도 동반된다는 설명이다. 특히 이번 연구에 제공된 질문의 개수는 제한적이었고, 특히 특정 범주에서 제공됐기 때문에 실제 결과는 다양할 수 있다고 연구진은 경고했다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.