컨텐츠 바로가기

    02.24 (화)

    이슈 IT기업 이모저모

    애플, 경량 AI 에이전트 '페렛-UI 라이트' 개발…작지만 강력

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [AI리포터]
    디지털투데이

    애플이 경량 모델 페렛-UI 라이트를 개발했다. [사진: 셔터스톡]

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털투데이 AI리포터] 애플이 3억 파라미터 규모의 인공지능(AI) 에이전트 '페렛-UI 라이트'를 개발했다.

    20일(이하 현지시간) IT매체 나인투파이브맥에 따르면, 페렛-UI 라이트는 30억 파라미터 규모에도 불구하고 24배 규모 모델과 견줄 만한 성능을 보인다. 페렛은 2023년 12월, 9명의 연구진이 발표한 논문에서 처음 소개됐다. 이 모델은 이미지 내 특정 영역을 자연어로 지정하면 해당 부분을 이해할 수 있는 멀티모달 대형 언어 모델(MLLM)이었다. 이후 페렛v2, 페렛-UI, 페렛-UI 2 등 다양한 버전이 공개됐다.

    페렛-UI는 130억 파라미터 규모의 모델로 모바일 UI 이해와 고정 해상도 스크린샷 처리에 초점을 맞췄으며, 페렛-UI 2는 다중 플랫폼 지원과 고해상도 인식 능력을 추가로 확보했다. 반면 페렛-UI 라이트는 기기에서 실행되도록 설계된 경량 모델로 훨씬 더 큰 그래픽 인터페이스(GUI) 에이전트와도 경쟁력을 유지한다.

    연구진은 기존 GUI 에이전트가 대규모 서버 기반 모델에 의존한다고 지적하며, 소형 모델로도 경쟁력 있는 성능을 구현할 수 있음을 강조했다. 이에 페렛-UI 라이트는 다양한 GUI 데이터를 활용하며, 실시간 크롭 및 줌인 기술을 적용해 작은 모델이 대형 이미지 데이터를 효과적으로 처리할 수 있도록 설계됐다. 특히, 이 모델은 자체적으로 학습 데이터를 생성하는 기능을 갖춰, 실제 GUI 환경에서의 상호작용을 보다 정밀하게 학습할 수 있다.

    흥미로운 점은 페렛-UI와 페렛-UI 2는 아이폰 스크린샷 및 기타 애플 인터페이스를 사용한 반면, 페렛-UI 라이트는 아이폰 대신 안드로이드, 웹, 데스크톱 환경에서 테스트됐다. 연구진은 이 모델이 단기 작업에서는 뛰어난 성능을 보이지만, 복잡한 다단계 작업에서는 한계가 있다고 평가했다. 하지만 기기 내에서 작동해 개인정보 보호 측면에서도 강점을 갖고 있으며, 클라우드 없이도 앱 인터페이스와 자동으로 상호작용할 수 있는 혁신적인 기술로 주목받고 있다.

    <저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.