컨텐츠 바로가기

    01.01 (목)

    고속·저비용 이미지 생성 모델 등장..."오픈 모델 중 최고 경쟁력"

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [박찬 기자]
    AI타임스

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    구글의 '나노 바나나'나 오픈AI의 'GPT 이미지 1.5'와 상업적으로 경쟁할 오픈 웨이트 기반 이미지 생성 모델이 등장했다. 기존 인기 모델인 '플럭스.2'를 경량화, 이를 통해 속도와 비용 경쟁력을 강화한 것이다.

    AI 미디어 생성 플랫폼 팔(fal.ai)은 29일(현지시간) 초고속 이미지 생성 모델 '플럭스.2 [데브] 터보(FLUX.2 [dev] Turbo)'를 공개했다.

    이는 블랙포레스트 랩스의 오픈 소스 이미지 모델 '플럭스.2 [데브](FLUX.2 [dev])'를 대폭 경량화한 것이다. 플럭스 2에 붙여서 사용하는 로라(LoRA) 어댑터 형태의 작은 보조 모델이다.

    이를 통해 이미지 품질을 유지하면서도 생성 속도와 비용을 크게 줄였다는 설명이다. 대부분 오픈 웨이트 모델보다 1.1~1.4배 빠르고 자체 풀 웨이트 베이스 모델 대비 6배 효율적이며 API 전용 상용 모델과 비교해 품질은 비슷하거나 우수하면서도 비용은 3~10배 저렴하다고 강조했다.

    기존 플럭스.2 [데브]는 이미지를 만들기 위해 약 50번의 추론 단계가 필요했지만, 터보는 단 8단계만으로도 비슷한 수준의 결과를 낸다. 이는 맞춤형 DMD2 증류 기법을 적용해 효율적으로 모델을 학습한 결과다.

    성능 지표도 눈에 띈다.

    아티피셜 애널리시스의 ELO 벤치마크에서 터보는 오픈 웨이트 이미지 모델 가운데 최고 점수(1166점)를 기록, 베이스 모델인 플럭스.2 [데브](1129점)와 알리바바의 '큐원 이미지 에디트 2509(1133점)' 등을 앞섰다.

    속도와 가격, 사용자 평가를 종합한 여프(Yupp) 벤치마크에서도 1024×1024 해상도 이미지를 6.6초 만에 0.008달러로 생성해 최저 비용을 기록했다.

    AI타임스

    아티피셜 애널리시스 이미지 편집 모델 ELO 스코어 (사진=AA)

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    모델은 허깅페이스를 통해 가중치가 공개됐으며, 블랙포레스트랩스가 설계한 비상업적 전용 라이선스로 제공된다. 또 전용 플레이 그라운드를 통해 바로 테스트해 볼 수도 있다.

    팔의 상용 API를 통해서도 연동된다. 텍스트-이미지 생성과 이미지 편집을 지원하고, 소비자용 GPU에서도 구동돼 내부 파이프라인에 쉽게 통합할 수 있다. 빠른 실험과 경량 배포에 적합한 구조다.

    하지만, 이 모델은 연구·실험·내부 평가 목적으로만 자유롭게 사용할 수 있으며, 별도의 계약 없이 상업적·프로덕션 환경에서의 사용은 금지된다. 생성된 이미지 자체를 상업적으로 활용하는 것은 허용되지만, 이를 경쟁 모델 학습에 사용하는 것은 제한된다.

    따라서 실제 마케팅, 제품 이미지, 고객용 서비스 등에 활용하려면 팔의 상용 API나 별도 라이선스를 통해야 한다. 이 회사는 최근 1억4000만달러 규모의 시리즈 D 투자 유치에 성공했으며, 이번 API 서비스로 사업 확장을 노리고 있다.

    한편, 지난주에는 중국의 성서우 테크놀로지가 기존 대비 최대 200배 빠른 속도로 고품질 AI 영상을 생성할 수 있는 영상 생성 가속 프레임워크 '터보디퓨전(TurboDiffusion)'을 공개한 바 있다.

    이처럼 이미지 품질을 유지하며 생성 속도와 비용을 낮추는 기술이 잇달아 공개되고 있다. 이는 이미지 생성이 소비자 유입의 주요한 기능으로 꼽히는 데다, 모델 성능 향상에 따라 기업 프로덕션 적용 가능성이 커짐에 따른 것이다.

    박찬 기자 cpark@aitimes.com

    <저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.