플럭스.2 [사진: 블랙포레스트랩스] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[디지털투데이 AI리포터] 독일 AI 스타트업 블랙포레스트랩스가 이미지 생성 AI 모델 플럭스.2(FLUX.2)를 출시했다.
이번 모델은 고성능을 유지하면서도 소비자용 GPU에서도 실행할 수 있도록 최적화돼, 실용적 이미지 생성 작업의 활용 폭을 크게 넓혔다고 26일(현지시간) 온라인 매체 기가진이 전했다.
플럭스.2의 핵심은 강력한 이미지 묘사 능력과 제어성이다. 최대 10개의 참조 이미지를 활용해 일관된 캐릭터와 스타일을 유지하는 멀티 레퍼런스 기능을 갖췄으며, 4메가픽셀 해상도의 고품질 이미지를 출력할 수 있다. 이 기능은 포스터나 인포그래픽처럼 복잡한 텍스트를 포함한 콘텐츠에서도 정교한 정확도를 제공한다. 특히 240억파라미터의 비주얼 언어 모델 미스트랄-3(Mistral-3)와 트랜스포머 기술을 결합해 현실 세계의 조명과 재질 표현을 보다 자연스럽게 구현하도록 설계됐다.
이와 같은 기술적 기반을 바탕으로 플럭스.2는 다양한 활용 환경을 고려한 네 가지 모델로 구성됐다. 최고급 모델 플럭스.2 프로(pro)는 폐쇄형 상위 모델과 견줄 만한 화질을 유지하면서도 빠르고 저렴한 이미지 생성을 지원한다. 플럭스.2 플렉스(flex)는 생성 스텝 수와 가이드 스케일을 세밀하게 조절할 수 있어 텍스트 렌더링 및 세부 묘사 성능을 필요로 하는 창작 환경에 적합하다. 여기에 오픈 웨이트 모델인 플럭스.2 디브(dev)는 허깅페이스를 통해 공개돼 개발자 접근성을 높였고, 경량화 버전인 플럭스.2 클라인(klein)은 오픈소스로 공개될 예정이다.
다만 우수한 성능만큼 높은 연산 능력도 요구된다. 320억파라미터 모델을 완전히 로드하려면 약 90GB VRAM이 필요하지만, 엔비디아와의 협업을 통해 FP8 양자화 기술을 적용하면서 메모리 사용량을 40% 줄였다. 이 최적화 덕분에 기존엔 실행이 어려웠던 고성능 모델을 지포스 RTX 같은 소비자용 GPU에서도 구동할 수 있게 됐다.
벤치마크 결과도 플럭스.2의 경쟁력을 뒷받침한다. 플럭스.2 프로는 낮은 비용으로 고품질 이미지를 생성했으며, 플럭스.2 디브 역시 경쟁 모델 대비 텍스트-이미지 생성에서 66.6%의 승률을 기록하는 등 강력한 성능을 확인했다.
특히 여러 이미지를 조합해 생성하는 다중 레퍼런스 작업 분야에서도 뛰어난 완성도를 보여, 모델의 확장성과 실용성이 더욱 부각되고 있다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
