컨텐츠 바로가기

04.24 (목)

애플, 아이폰 사용자 데이터로 기기에서 AI 학습 시작…"데이터 유출 없이 AI 성능 개선"

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]

(사진=셔터스톡)

<이미지를 클릭하시면 크게 보실 수 있습니다>


애플이 사용자 데이터를 직접 수집하거나 기기에서 복사하지 않고도 인공지능(AI) 성능을 향상할 수 있는 새로운 훈련 방식을 도입한다고 발표했다. 이는 애플 인텔리전스 출시 당시부터 강조했던 차별화 기능으로, 거의 10개월 만에 구현에 나선 것이다.

애플은 14일(현지시간) 블로그를 통해 AI 모델을 위한 새로운 훈련 방식을 도입했다고 발표했다.

핵심은 사용자 데이터를 기기 밖으로 유출하지 않는 것은 물론, 현실에 가까운 '합성 데이터'로 모델 성능을 개선하는 것이다.

현재 애플은 실제 사용자 정보를 포함하지 않은 합성 데이터를 기반으로 AI 모델을 훈련하고 있다. 하지만, 이 방식은 사용자 행동을 충분히 반영하지 못해 응답의 현실성과 정확도가 떨어질 수 있다는 지적을 받아왔다.

이를 보완하기 위해 '기기 분석(Device Analytics)' 프로그램에 동의한 사용자의 기기 내 최근 이메일이나 메시지 샘플을 활용하는 방식을 채택한다.

이 데이터가 서버로 직접 전송되는 일은 없으며, 기기 자체에서 합성 데이터셋과 비교해 가장 유사한 항목을 판단한 뒤 '가장 비슷한 것이 무엇이었는지에 대한 신호'만을 애플에 전송하는 방식이다.

이때 애플은 어떤 기기에서 어떤 데이터가 선택됐는지는 알 수 없으며, 단지 전체적으로 어떤 합성 데이터가 자주 선택되는지만 파악한다고 밝혔다.

합성 메시지의 다양한 변형을 생성하는 과정 (사진=애플)

<이미지를 클릭하시면 크게 보실 수 있습니다>


가장 자주 선택된 합성 데이터는 이후 AI 모델 훈련이나 테스트용 데이터 생성에 활용될 수 있으며, 추가적인 큐레이션 과정을 통해 데이터셋을 더욱 정제하는 데에도 사용할 수 있다. 예를 들어, "테니스를 하자"라는 내용의 메시지가 선택됐다면, 다른 상황에 이를 적용하기 위해 테니스를 '축구'나 다른 스포츠로 바꾼 유사한 메시지를 생성해 데이터셋에 추가할 수 있다.

애플은 "이 방식은 사용자 데이터 자체에는 접근하지 않으며, 데이터는 절대 기기를 벗어나지 않는다"라고 강조했다. 이런 안전장치 덕분에 사용자 이메일 내용을 수집하거나 열람하지 않고도, 전체적인 사용 패턴을 반영한 합성 데이터를 생성할 수 있다는 설명이다.

그동안 애플은 경쟁사들과 달리 사용자 프라이버시 보호를 우선시하며 실제 데이터를 활용하지 않는 전략을 유지해 왔다. 하지만 이로 인해 AI 기능의 정밀도나 실용성 면에서 한계를 지적받아 왔던 것도 사실이다. 새로운 시스템은 이 같은 약점을 보완할 수 있는 기술적 해법이 될 것으로 보인다.

애플은 이 AI 훈련 방식을 iOS 및 아이패드OS 18.5, 맥OS 15.5의 베타 버전에 우선 도입한 뒤, 점차 확대할 계획이다. '통합 시리'의 출시는 늦어졌지만, '애플 인텔리전스'가 제대로 성능을 발휘하는 것은 지금부터라는 평이다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.