컨텐츠 바로가기

    02.25 (수)

    이슈 인공지능 시대가 열린다

    오픈AI, 음성 AI 전략 본격화…2026년 신형 오디오 모델 공개 예정

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [AI리포터]
    디지털투데이

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털투데이 AI리포터] 오픈AI가 차세대 AI 디바이스를 염두에 두고 음성 인공지능(AI)을 핵심 전략으로 삼아 조직을 통합하고 새로운 음성 모델 개발에 속도를 내고 있다.

    5일(현지시간) 온라인 매체 기가진에 따르면, 오픈AI는 엔지니어링·제품·연구팀을 하나로 묶어 음성 AI를 전면적으로 재정비하고 있으며, 이는 향후 출시 예정인 음성 기반 AI 디바이스를 위한 준비 과정으로 전해졌다. 오픈AI는 음성을 중심으로 한 인터페이스가 차세대 AI 활용의 핵심이 될 것으로 보고 관련 역량을 집중 강화하고 있다.

    보도에 따르면 오픈AI는 2026년 초 공개를 목표로 새로운 음성 모델을 개발 중이다. 이 모델은 기존보다 훨씬 자연스러운 음성을 구현하고, 실제 사람처럼 대화 도중 끼어들거나 사용자가 말하는 중에도 음성을 출력하는 등 기존 음성 모델에서는 구현하기 어려웠던 기능을 제공할 것으로 알려졌다. 현재 주력 모델인 GPT-리얼타임(GPT-realtime)은 트랜스포머 아키텍처 기반이지만, 새 모델의 구조는 아직 공개되지 않았다.

    새 음성 모델 개발은 캐릭터AI(Character.AI) 출신 연구자인 쿤단 쿠마르가 이끄는 팀이 주도하고 있으며, 오픈AI는 과거 위스퍼(Whisper)처럼 출력 품질이 다른 여러 버전의 음성 모델을 선보일 가능성도 제기되고 있다. 위스퍼는 음성을 스펙트로그램으로 변환해 처리하는 방식의 음성 모델로, 다양한 성능 옵션을 제공해 왔다.

    <저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.