![]() |
[디지털투데이 AI리포터] 게임 플레이 영상에서 주요 장면을 자동으로 추출해 자막과 내레이션이 포함된 세로형 쇼츠 영상을 제작해 주는 AI 기반 도구 오토쇼츠(AutoShorts)가 공개됐다.
8일(현지시간) 온라인 매체 기가진에 따르면, 오토쇼츠는 오픈AI나 제미나이 모델을 활용해 영상 콘텐츠를 액션, 웃긴 장면, 클러치, 예기치 못한 사건, 에픽 실패, 하이프, 스킬 등 7가지 카테고리로 정밀하게 분류한다. 특히 AI 음성 합성 엔진인 큐웬3-TTS(Qwen3-TTS)를 탑재해 자막 스타일과 내용에 최적화된 내레이션을 생성하며, 한국어를 포함해 영어, 중국어, 일본어 등 10개 이상의 다국어를 지원하는 것이 특징이다.
성능 면에서는 GPU 가속 렌더링을 통해 로컬 환경에서도 빠른 처리 속도를 구현했다. 위스퍼(Whisper)를 이용한 음성 자막 생성 기능과 AI 기반 자동 작성 기능을 동시에 제공하며, 사용자는 게임용, 극적, 코믹, Z세대용 등 다양한 자막 스타일을 선택할 수 있다. 또한 파이캡스(pycaps)와 연동되어 영상 분위기에 맞는 폰트와 이모지도 자동으로 적용된다.
사용 환경은 엔비디아 GPU를 탑재한 윈도11 기반에서 WSL2와 도커(Docker)를 통해 구축된다. 설치 후 게임 영상 파일을 지정하고 환경 변수를 설정하면, 오토쇼츠가 자동으로 편집된 쇼츠 영상과 로그 파일을 생성해 전용 폴더에 저장하는 방식으로 작동한다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

