컨텐츠 바로가기

최강 '타이포그래피' 이미지 생성 모델 등장...'이디오그램'과 경쟁 구도

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
[박찬 기자]

<이미지를 클릭하시면 크게 보실 수 있습니다>


인공지능(AI) 스타트업 레브 AI가 이미지 내부에 정확한 단어를 생성하는 '타이포그래피' 기능을 강점으로 내세운 이미지 생성 모델을 출시했다. 이 분야 최강자인 이디오그램 등과의 경쟁이 불가피해졌다.

레브 AI는 26일(현지시간) 깃허브를 통해 텍스트-이미지 생성 모델 '레브 이미지 1.0(Reve Image 1.0)'을 출시했다고 발표했다.

프리뷰 사이트에서 무료 미리보기 형태로 제공된다. API 제공 여부나 가격 정책, 오픈 소스 공개 가능성 등에 대해서는 아직 명확한 입장을 밝히지 않았다.

레브 이미지는 사용자 의도를 더욱 깊이 파악하는 것을 목표로 하며, 복잡한 프롬프트 엔지니어링 없이도 텍스트 설명만으로 손쉽게 이미지를 생성할 수 있다.

단순히 텍스트로 이미지를 생성하는 것뿐만 아니라, 기존 이미지를 간단한 언어 명령으로 수정하는 기능도 제공한다. 예를 들어, 색상을 변경하거나 텍스트를 조정하고 시점을 변형하는 등의 수정이 가능하다.

또 참조 이미지를 업로드할 수 있어, 특정 스타일이나 영감을 반영한 비주얼을 제작하는 데 활용할 수 있다.

특히 정확한 텍스트 렌더링 기능은 AI 이미지 생성 분야에서 난제로 꼽혔던 난제를 해결 이디오그램과 같은 타이포그래피 중심 이미지 모델과 직접적인 경쟁력을 갖추게 만들었다. 이는 로고 및 브랜드 디자인을 원하는 사용자들에게 매우 유용한 기능으로 꼽힌다.

https://twitter.com/reveimage/status/1904211082870456824

테스트 결과, 레브 이미지는 기존 모델보다 여러 개체가 포함된 다중 캐릭터 프롬프트를 효과적으로 처리하는 것으로 나타났다.

이미 AI 모델 평가 기관 아티피셜 애널리시스가 운영하는 '이미지 아레나(Image Arena)'에서 이미지 생성 품질 부문 1위를 기록했다. 이 순위는 사용자 피드백과 정량적 평가 지표를 종합한 결과로, '미드저니 v6.1'과 구글 '이마젠 3', '리크래프트 V3', 블랙 포레스트 랩스의 '플럭스 1.1 프로' 등을 제쳤다.

<이미지를 클릭하시면 크게 보실 수 있습니다>


정식 출시 전부터 소셜 미디어에서 '하프 문(Halfmoon)'이라는 코드명으로 알려지며 추측과 기대를 불러일으킨 바 있다.

초기 사용자 사이에서도 긍정적인 반응이 이어지고 있다. 특히 프롬프트 처리 정확도, 텍스트 삽입 능력, 생성 속도에서 높은 평가를 받고 있으며, 복잡한 장면 구성에서도 뛰어난 성능을 보인다는 점이 강점으로 꼽힌다.

그러나 일부 사용자들은 투명한 물체 표현의 어려움, 특정 가상의 캐릭터 인식 한계, 복잡한 다중 객체 배치 시 세부 요소가 틀어지는 문제 등을 지적했다.

미카엘 카르비 레브 AI 공동 창립자는 "레브 이미지는 단순히 시각적으로 그럴듯한 이미지를 생성하는 것을 넘어, 인간의 창의적 의도를 이해하는 모델을 목표로 하고 있다"라며 "언어와 시각적 요소를 보다 정교하게 해석할 수 있는 새로운 '의미적 중간 표현 체계'를 구축할 계획"이라고 강조했다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.