컨텐츠 바로가기

    03.19 (목)

    이슈 애니메이션 월드

    엔비디아, 3D 모션 생성하는 '키모도' 공개..."로봇 학습 데이터에 유용"

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [박찬 기자]

    엔비디아가 로보틱스와 시뮬레이션, 엔터테인먼트 분야에서 활용 가능한 고품질 인간 동작 생성 AI 모델을 공개했다.

    엔비디아는 16일(현지시간) 대규모 모션 캡처 데이터를 기반으로 정밀하고 제어 가능한 3D 모션을 생성하는 모델 '키모도(Kimodo)'를 공개했다.

    최근 생성 AI는 텍스트 입력만으로 인간의 움직임을 만들어내는 기술로 발전하고 있지만, 기존에는 공개 모션 캡처(mocap) 데이터셋의 규모가 작아 품질과 정밀도, 일반화 성능에 한계가 있었다. 키모도는 이러한 문제를 해결하기 위해 약 700시간 규모의 광학 모션 캡처 데이터를 학습에 활용했다.

    가장 큰 특징은 높은 표현력과 정밀한 제어 능력이다. 사용자는 텍스트 프롬프트뿐 아니라 다양한 운동학적 제약 조건을 함께 입력해 원하는 동작을 생성할 수 있다.

    예를 들어 특정 시점의 전신 자세, 일부 관절의 위치나 회전, 2D 경로 및 이동 경로 등을 지정하면, 모델이 이를 반영해 자연스러운 움직임을 만들어낸다.

    AI타임스

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    이러한 성능은 특수하게 설계된 모션 표현 방식과 '2단계 디노이저(denoiser)' 구조를 통해 구현됐다. 모델은 먼저 캐릭터의 전체 이동(루트 모션)을 예측한 뒤, 세부적인 신체 움직임을 생성하는 방식으로 동작한다. 이를 통해 흔히 발생하는 발 미끄러짐이나 부자연스러운 움직임을 줄이면서도 다양한 조건을 유연하게 반영할 수 있다.

    키모도는 확산(diffusion) 모델을 기반으로, 노이즈가 섞인 동작 데이터를 점진적으로 정제해 최종적인 3D 인간 동작을 생성한다. 이 과정에서 텍스트 임베딩과 제약 조건, 현재 동작 상태를 동시에 고려해 일관성 있는 결과를 도출한다.

    또 손과 발 등 특정 관절만 선택적으로 제어하거나, 캐릭터의 이동 경로를 곡선 형태로 지정하는 등 세밀한 제어도 가능하다. 이를 통해 애니메이션 제작이나 로봇 학습 데이터 생성 등 다양한 활용 시나리오에 대응할 수 있다.

    실제 개발 환경에서도 활용성을 고려해 설계됐다. 파이썬 API를 통해 동작을 생성하고 다양한 포맷으로 내보낼 수 있으며, 물리 기반 시뮬레이션 도구와 연동해 로봇 정책 학습 데이터로 활용할 수도 있다. 특히 휴머노이드 로봇 학습에서는 기존 원격 조작(teleoperation) 대비 훨씬 빠르고 효율적으로 데이터를 생성할 수 있는 장점이 있다.

    모델과 코드는 허깅페이스와 깃허브를 통해 제공된다.

    박찬 기자 cpark@aitimes.com

    <저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.