생성 속도 4배 향상 정밀한 편집
표·텍스트·포스터 등 결과물 개선
35㎜ 컬러필름 느낌도 구현해내
출시 직후 성능 평가서 선두 올라
오픈AI 샘 알트먼 CEO 사진을 업로드한 뒤, "'진주 귀걸이를 한 소녀' 그림 속 인물로 바꿔달라"고 지시한 이미지. 오픈AI 제공 |
인공지능(AI) 이미지 생성 시장의 주도권 경쟁이 뜨거워지고 있다. 구글의 제미나이3 프로 기반의 이미지 모델 '나노바나나 프로'가 공개 직후부터 호평이 쏟아지자, 오픈AI가 예정 시점을 앞당겨 새 이미지 모델을 전면에 내세웠다. 당초 내년 1월 초 출시 예정이던 차세대 모델을 조기 투입하며, 이미지 AI 경쟁에서 반격에 나선 것으로 보인다.
오픈AI는 이미지 생성·편집 도구인 '챗GPT 이미지 1.5'를 업데이트했다고 17일 밝혔다. 오픈AI가 공개한 '챗GPT 이미지 1.5'는 챗GPT에 기본 탑재되는 새로운 플래그십 이미지 모델이다. 단순히 더 잘 그리는 수준을 넘어, 기존 이미지를 정밀하게 편집하는 능력을 핵심 경쟁력으로 내세웠다. 이미지 생성 속도는 이전 모델 대비 최대 4배 빨라졌고, 반복 편집 과정에서도 시각적 디테일을 안정적으로 유지한다.
가장 눈에 띄는 변화는 프롬프트 기반 편집 정밀도다. 사용자가 이미지를 업로드한 뒤 '이 부분만 바꿔 달라'고 지시하면, 조명·구도·인물 외형 등 핵심 요소는 그대로 둔 채 요청한 부분만 정확히 수정한다. 예컨대 스케이트보드를 타는 사람 모습을 사진처럼 생성한 뒤, 옷과 모자 색상만 바꾸거나 이미지 속 문구만 교체하는 식의 편집이 가능하다. 1990년대 후반 다큐멘터리풍 스트리트 사진 스타일, 35mm 컬러 필름으로 촬영한 느낌, 또는 라이카M 스타일의 레인지파인더 카메라에 35mm 렌즈 사용 등 구체적인 지시도 가능하다. 기존 이미지 AI에서 빈번하게 발생하던 전체 이미지 왜곡이나 디테일 붕괴가 크게 줄었다.
새로운 음료 'SOTA'를 위한 빈티지 탄산음료 광고를 만들어 달라는 지시어에 맞춰 생성된 이미지. 오픈AI 제공 |
사진에 등장하는 인물을 캐릭터처럼 활용해 새로운 작품을 만드는 창의적 변환 능력도 강화됐다. 예를 들어 샘 알트먼 사진을 업로드 한 뒤 "'진주 귀걸이를 한 소녀' 그림 속 인물로 바꿔달라"고 하면, 원작의 화풍과 구도, 명암은 유지한 채 인물만 자연스럽게 대체한다. 텍스트 지시를 안정적으로 반영해 단순 합성이 아니라, 스타일·레이아웃·표현 방식을 함께 이해하고 재구성하는 수준까지 성능이 강화됐다.
이전 버전에서는 '가로 6칸, 세로 6줄의 표를 그려달라'는 명령어가 제대로 이행되지 않았지만, 이번 버전은 좀 더 이용자의 의도에 맞춘 결과물이 생성된다고 오픈AI는 설명했다.
텍스트 처리 성능 역시 개선됐다. 이미지 안에 들어가는 작은 글씨나 촘촘한 문구도 비교적 정확하게 구현해, 광고 시안이나 포스터, 제품 이미지 제작에도 바로 활용할 수 있다. 생성된 이미지를 인포그래픽이나 시각 자료 형태로 변환하는 작업도 자연스럽게 처리한다.
오픈AI의 반격은 일단 성능 지표에서 긍정적 성적을 거뒀다. AI 모델 성능을 평가하는 플랫폼인 'LM아레나 리더보드'에서 챗GPT-이미지-1.5는 출시 직후 기존 1위였던 구글의 나노바나나 프로를 제치고 선두에 올랐다. LM 아레나 이용자들은 블라인드 투표로 선호하는 모델을 고른다. 다만 순위는 실시간으로 변동된다.
샘 올트먼 오픈AI CEO는 구글의 '제미나이 3프로'와 나노바나나 프로 출시 이후, 코드레드를 발령하고 AI 기술 경쟁에서 주도권을 되찾기 위한 대응 전략을 전면 가동 중이다.
챗GPT 이미지 1.5버전으로 옷 색깔 등 세부 사항만 수정한 이미지. 테크크런치 제공·뉴시스 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
yjjoe@fnnews.com 조윤주 기자
Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
