<이미지를 클릭하시면 크게 보실 수 있습니다> |
앤트로픽이 여러 AI 에이전트를 활용해 소프트웨어 변경 코드를 자동 검토하는 새로운 개발 도구 '코드 리뷰(Code Review)'를 공개했다. 이 기능은 코드 품질 검증을 자동화해 AI 기반 코드 생성이 늘면서 발생한 코드 검토 병목 현상을 해결하는 것을 목표로 한다.
앤트로픽은 9일(현지시간) '클로드 코드'에 통합된 다중 에이전트 코드 검토 시스템 코드 리뷰를 연구 프리뷰 형태로 출시했다고 밝혔다. 이 기능은 현재 팀 및 엔터프라이즈 고객을 대상으로 베타 버전으로 제공된다.
코드 리뷰는 개발자가 풀 리퀘스트(PR)를 생성하면 여러 AI 에이전트를 동시에 실행해 코드 변경 사항을 분석하는 방식으로 작동한다.
각 에이전트는 서로 다른 관점에서 코드 버그를 탐색하고, 발견된 문제를 교차 검증해 오탐(false positive)을 줄인 뒤 심각도에 따라 우선순위를 매긴다. 결과는 PR에 단일 요약 코멘트와 함께 코드 라인별 주석 형태로 제공된다.
코드 리뷰는 코드 변경 규모에 따라 분석 수준을 자동으로 조정하는 방식으로 작동한다. 예를 들어 대규모이거나 복잡한 PR의 경우 더 많은 에이전트를 투입해 심층적인 분석을 수행한다. 변경 규모가 작은 경우에는 경량 분석을 진행해 불필요한 자원 사용을 줄이고 효율적으로 검토가 이루어지도록 한다.
앤트로픽에 따르면 평균 리뷰 시간은 약 20분 정도다. 이는 즉각적인 피드백을 제공하는 일부 자동 리뷰 도구보다 느리지만, 속도보다 깊이 있는 분석을 목표로 설계된 것이라는 설명이다.
실제로 최근 AI 코딩 도구 확산으로 개발 생산성이 크게 늘면서 인간의 코드 검토 부담이 급증하고 있다.
앤트로픽 내부 데이터에 따르면, 지난 1년 동안 엔지니어 1인당 코드 생산량이 약 200% 증가했다. 코드 검토 과정이 개발 속도를 늦추는 주요 병목으로 떠올랐다는 지적이다.
하지만 코드 리뷰 도입 전에는 앤트로픽 내부 PR 중 실질적인 리뷰 코멘트가 달린 비율이 16%에 불과했지만, 도입 이후에는 54%로 증가했다고 밝혔다.
하지만, 코드 리뷰는 PR 승인 권한을 갖지 않는다. 최종 승인 여부는 여전히 인간 개발자가 결정한다.
앤트로픽은 코드 리뷰가 사람이 놓치기 쉬운 오류를 발견한 사례도 공개했다. 한 생산 서비스에서 단 한줄의 코드 수정이 포함된 PR이 제출됐을 때, 인간 리뷰어는 단순 변경으로 보고 빠르게 승인할 가능성이 높았다. 그러나 코드 리뷰는 수정 사항이 서비스 인증 시스템을 완전히 중단시킬 수 있는 치명적 오류임을 발견했고, 실제 병합 전에 문제가 수정됐다는 것이다.
또 다른 사례에서는 오픈소스 스토리지 플랫폼 트루NAS(TrueNAS)의 ZFS 암호화 코드 리팩터링 과정에서 기존 코드에 숨어 있던 버그를 발견했다. 이 버그는 동기화 시 암호화 키 캐시를 계속 초기화하는 타입 불일치 문제였다.
코드 리뷰는 토큰 사용량 기반으로 과금되며, 평균 비용은 PR당 15~25달러 수준이다. 코드 규모와 복잡도에 따라 비용이 달라진다.
관리자는 다양한 방법을 통해 시스템의 비용을 효율적으로 관리할 수 있다. 먼저 조직 전체에 대해 월간 비용 상한선을 설정해 예산 범위 내에서 서비스가 운영되도록 할 수 있다. 또 특정 저장소에서만 기능을 활성화하도록 설정해 필요한 프로젝트에만 선택적으로 적용할 수도 있다.
이와 함께 분석 대시보드를 통해 PR 리뷰 수와 이에 따른 비용을 지속적으로 추적하며 운영 상황을 확인할 수 있다.
앤트로픽은 이 기능을 단순한 생산성 향상 도구라기보다 '코드 품질을 위한 보험'과 같은 개념으로 설명했다. 또 "운영 환경에서 발생하는 단 한번의 장애를 해결하는 비용이 PR 리뷰에 드는 비용보다 훨씬 클 수 있다"라며, 사전에 코드를 검증하는 과정의 중요성을 강조했다.
현재 코드 리뷰는 연구 미리보기 단계로 제공되며, 기업 개발팀은 깃허브 앱을 설치하고 저장소를 연결하면 자동으로 PR 리뷰를 실행할 수 있다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
