<이미지를 클릭하시면 크게 보실 수 있습니다> |
인공지능(AI) 스타트업 레브 AI가 이미지 내부에 정확한 단어를 생성하는 '타이포그래피' 기능을 강점으로 내세운 이미지 생성 모델을 출시했다. 이 분야 최강자인 이디오그램 등과의 경쟁이 불가피해졌다.
레브 AI는 26일(현지시간) 깃허브를 통해 텍스트-이미지 생성 모델 '레브 이미지 1.0(Reve Image 1.0)'을 출시했다고 발표했다.
프리뷰 사이트에서 무료 미리보기 형태로 제공된다. API 제공 여부나 가격 정책, 오픈 소스 공개 가능성 등에 대해서는 아직 명확한 입장을 밝히지 않았다.
레브 이미지는 사용자 의도를 더욱 깊이 파악하는 것을 목표로 하며, 복잡한 프롬프트 엔지니어링 없이도 텍스트 설명만으로 손쉽게 이미지를 생성할 수 있다.
또 참조 이미지를 업로드할 수 있어, 특정 스타일이나 영감을 반영한 비주얼을 제작하는 데 활용할 수 있다.
https://twitter.com/reveimage/status/1904211082870456824
테스트 결과, 레브 이미지는 기존 모델보다 여러 개체가 포함된 다중 캐릭터 프롬프트를 효과적으로 처리하는 것으로 나타났다.
이미 AI 모델 평가 기관 아티피셜 애널리시스가 운영하는 '이미지 아레나(Image Arena)'에서 이미지 생성 품질 부문 1위를 기록했다. 이 순위는 사용자 피드백과 정량적 평가 지표를 종합한 결과로, '미드저니 v6.1'과 구글 '이마젠 3', '리크래프트 V3', 블랙 포레스트 랩스의 '플럭스 1.1 프로' 등을 제쳤다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
정식 출시 전부터 소셜 미디어에서 '하프 문(Halfmoon)'이라는 코드명으로 알려지며 추측과 기대를 불러일으킨 바 있다.
초기 사용자 사이에서도 긍정적인 반응이 이어지고 있다. 특히 프롬프트 처리 정확도, 텍스트 삽입 능력, 생성 속도에서 높은 평가를 받고 있으며, 복잡한 장면 구성에서도 뛰어난 성능을 보인다는 점이 강점으로 꼽힌다.
그러나 일부 사용자들은 투명한 물체 표현의 어려움, 특정 가상의 캐릭터 인식 한계, 복잡한 다중 객체 배치 시 세부 요소가 틀어지는 문제 등을 지적했다.
미카엘 카르비 레브 AI 공동 창립자는 "레브 이미지는 단순히 시각적으로 그럴듯한 이미지를 생성하는 것을 넘어, 인간의 창의적 의도를 이해하는 모델을 목표로 하고 있다"라며 "언어와 시각적 요소를 보다 정교하게 해석할 수 있는 새로운 '의미적 중간 표현 체계'를 구축할 계획"이라고 강조했다.
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.