오픈AI GPT-4 안과 지식, 전공의 수준…연구

디지털투데이 원문
입력

2024.04.19 14:49

주소복사가 완료되었습니다

[AI리포터]

챗GPT [사진: 셔터스톡]

<이미지를 클릭하시면 크게 보실 수 있습니다>

[디지털투데이 AI리포터] 영국 케임브리지 대학교 임상의학과의 연구 결과, 오픈AI의 GPT-4가 의료 분야 중 안과 평가에서 전공의 수준의 성능을 보였다고 18일(현지시간) IT매체 엔가젯이 전했다.

연구진은 GPT-4와 GPT-3.5, 구글 팜2(PaLM 2), 메타 라마를 87개의 객관식 질문으로 테스트했다. 더불어 전문의 5명, 일반의 2명, 수습의 3명이 동일한 모의고사를 실시했으며, 해당 문제는 빛에 대한 민감성에서 병변에 이르기까지 의대 교과서를 기반으로 출제됐다.

그 결과, GPT-4는 87개 문항 중 60개를 맞혀 수습의와 일반의보다 높은 점수를 받았다. 수습의의 평균 정답 개수는 59.7개, 일반의는 37개였다. 전문의의 경우 평균 66.4개로 GPT-4를 능가했다. 또한 팜2는 49점, GPT-3.5는 42점을 받았다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

05.03 (금)

오픈AI GPT-4 안과 지식, 전공의 수준…연구

디지털투데이 주요 뉴스