오픈AI, '데브데이'서 생태계 확장에 초점...타사 앱에 음성 비서 지원하는 도구 등 공개

AI타임스 원문
박찬
입력

2024.10.02 18:00

최종수정

2024.10.02 19:25

주소복사가 완료되었습니다

[박찬 기자]

<이미지를 클릭하시면 크게 보실 수 있습니다>

오픈AI가 연례 개발자 회의인 '데브데이(DevDay)'에서 개발자들이 자사 AI 모델 기반으로 애플리케이션을 보다 쉽게 개발할 수 있는 도구들을 선보였다. 'GPT-4 터보' 'GPT 빌더' 'GPT 스토어' 등을 출시하며 파장을 일으켰던 지난해와 달리, 이번 행사에서는 개발자들을 위한 다양한 도구들을 선보이며 자사 AI 모델 중심의 생태계 확대를 꾀하고 있다.

오픈AI는 1일(현지시간) 샌프란시스코에서 열린 데브데이에서 기업과 개발자를 위한 음성 기반 애플리케이션 구축용 '리얼타임 API(Realtime API)' 이미지와 텍스트로 'GPT-4o'를 미세조정하는 '비전 미세조정(Vision Fine-Tuning)' 대형 프론티어 모델 출력으로 작은 모델 미세조정하는 '모델 증류(Model Distillation)' 사용자 입력을 재사용하는 '프롬프트 캐싱(Prompt Caching)' 등을 출시했다.

먼저 '리얼타임 API'는 개발자가 애플리케이션에 오픈AI의 AI 모델을 사용해 멀티모달 처리 기능을 장착할 수 있도록 하는 클라우드 서비스다. 이를 통해 타사의 애플리케이션도 음성 명령을 이해하고 응답을 소리내어 읽어주는 기능을 추가할 수 있다.

일반적으로 AI 모델이 음성 명령을 처리하려면 여러 단계를 거쳐야 한다. 개발자는 오디오를 텍스트로 변환하고, 그 텍스트를 모델에 입력한 뒤, 모델의 텍스트 기반 출력을 합성 음성으로 변환해야 한다. 리얼타임 API는 이런 단계를 거치지 않고 GPT-4o에 오디오를 직접 스트리밍할 수 있게 해준다.

개발을 단순화할 뿐만 아니라 모델 지연 시간도 줄일 수 있다. 그 결과, 리얼타임 API를 사용하는 AI 애플리케이션은 사용자 지시에 더 빠르게 응답할 수 있다. 또 이 서비스는 애플리케이션이 외부 시스템에서 작업을 자동으로 수행할 수 있는 기능도 제공한다.

이를 통해 많은 기업이나 개발자가 오픈AI 서비스를 사용, 수익을 확대하려는 의도다.

이미지를 처리하는 애플리케이션을 구축하는 개발자를 위해 '비전 파인 튜닝'도 마찬가지다. 이 도구는 개발자가 GPT-4o에 맞춤형 이미지 데이터를 제공, 컴퓨터 비전 작업에서 생성한 결과물을 개선할 수 있도록 지원한다.

모델의 이미지 이해 역량을 개선해 비주얼 검색과 자율주행 차량을 위한 사물 탐지 기능 등을 강화할 수 있다. 예를 들어, 웹사이트 레이아웃을 생성하기 위해 GPT-4o를 사용하는 기업은 모델에 샘플 디자인 모음을 제공할 수 있다. GPT-4o의 성능을 향상시키는 데 필요한 이미지는 최소 100장 정도로 충분하다.

이 외에도 오픈AI는 추론 비용을 낮추기 위해 설계된 두가지 기능을 선보였다. '모델 증류'는 지식 증류라는 AI 방법을 통해 비용 절감을 실현한다. 이 방법은 개발자가 대형 고성능 모델을 더 적은 하드웨어를 사용하는 작은 모델로 대체할 수 있게 한다.

같은 프롬프트를 입력할 경우, 큰 신경망은 작은 신경망보다 더 나은 응답을 생성할 가능성이 크다. 이때 지식 증류를 통해 개발자는 더 큰 모델의 고품질 응답을 가져와 작은 모델에 입력할 수 있다. 이를 통해 작은 모델도 더 적은 하드웨어를 사용하면서 고급 모델과 비슷한 품질의 출력을 생성할 수 있다.

모델 증류 기능은 API를 통해 제공된다. 이를 통해 개발자는 오픈AI의 최첨단 모델 중 하나에 프롬프트를 제출하고, 그 모델의 응답을 AI 학습 데이터셋으로 변환할 수 있다. 이 데이터셋은 작은 모델의 품질을 향상시키는 데 사용될 수 있다.

오픈AI가 고객의 추론 비용을 절감하기 위해 출시한 또 다른 기능은 '프롬프트 캐싱'이다. 이 기능은 특정 상황에서 사용자의 입력을 재사용하여 이전에 완료한 계산을 반복하지 않도록 한다. 오픈AI는 이 기능을 통해 최대 50%의 추론 비용 절감과 응답 시간 개선을 기대하고 있다.

한편, 오픈AI는 "현재 수십개국에서 300만명의 개발자가 우리의 기술을 실험 중"이라고 밝혔다.

데브데이는 10월30일 런던, 11월21일 싱가포르 등 3차례에 걸쳐 진행된다. 이 자리에서 주요 모델 공개는 이뤄지지 않을 것이라고 예고했다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

10.03 (목)

오픈AI, '데브데이'서 생태계 확장에 초점...타사 앱에 음성 비서 지원하는 도구 등 공개

AI타임스 주요 뉴스