핵심요소 유지하며 정밀 수정 ‘새 버전’ 출시…카탈로그 등 전자상거래에 적합
왼쪽 이미지 속 스케이트보드를 탄 남성의 티셔츠와 모자를 각각 빨간색과 노란색으로 바꾸고, 제한속도 표시는 15로 설정하며 트럭은 소방차로 바꿔 달라고 지시한 결과물. 오픈AI 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
오픈AI가 기존 단점을 대폭 보완한 이미지 생성·편집 도구 ‘챗GPT 이미지 1.5’를 선보였다. 이미지 생성 도구를 둘러싼 구글 등 글로벌 빅테크의 경쟁이 날로 뜨거워지는 모습이다.
16일(현지시간) 출시된 챗GPT 이미지 1.5의 가장 큰 특징은 조명이나 구도, 인물 외형 같은 핵심 요소는 그대로 유지하면서 세부 사항을 정밀하게 수정할 수 있다는 점이다.
기존에는 이미지 속 특정 부분만 고치려 하면 인공지능(AI)이 전체 이미지를 다시 생성해야 했다. 그러다 보니 정교한 통제가 안 돼 원하는 이미지를 얻지 못하는 경우가 많았다.
새 버전은 이용자의 지시(프롬프트)를 해석하는 능력이 높아져 개별 요소의 ‘미세 조정’이 가능하다. 예를 들어 스케이트보드를 타는 남성(사진)의 이미지를 준 뒤 남성의 티셔츠와 모자 색깔만 바꿔 달라고 요청하면 나머지 요소는 건드리지 않은 채 지정된 부분만 수정해내는 식이다.
이미지 생성 속도는 이전 모델보다 최대 4배 빨라졌으며, 약점이었던 텍스트 처리 능력도 크게 향상됐다. 기존에는 이미지 속 글자를 제대로 구현해내지 못하는 사례가 빈번했다.
오픈AI 측은 이 같은 개선이 “그래픽·로고 제작과 같은 마케팅·브랜딩 작업, 다양한 제품 이미지 카탈로그를 생성해야 하는 전자상거래에 특히 적합하다”며 “이전 버전 대비 이미지 입력·출력 비용이 20% 더 저렴해 같은 예산으로 더 많은 이미지를 생성 및 반복 작업할 수 있다”고 설명했다.
일명 ‘지브리풍 이미지’가 놀이에 그쳤다면, 이젠 업무나 상업적 목적으로 활용될 수준에 이르렀음을 강조한 것이다.
오픈AI의 챗GPT 이미지 1.5 출시는 구글의 이미지 생성·편집 도구 ‘나노 바나나 프로’ 출시 26일 만이다. ‘포토샵이 필요 없다’는 평가를 받는 나노 바나나 프로가 오픈AI에 긴장감을 불어넣었다고 평가된다. 미국 정보기술(IT) 전문매체 테크크런치는 “오픈AI는 이미지 1.5를 1월 초 공개할 계획이었으나 일정을 앞당겼다”고 전했다.
글로벌 AI 업계의 이미지·영상 생성 도구 경쟁은 격화 중이다. 이날 중국의 알리바바 역시 비주얼 생성 모델 완(Wan)의 최신 버전인 ‘완 2.6’을 공개하며 경쟁에 가세했다.
최민지 기자 ming@kyunghyang.com
▶ 매일 라이브 경향티비, 재밌고 효과빠른 시사 소화제!
▶ 더보기|이 뉴스, 여기서 끝나지 않습니다 → 점선면
©경향신문(www.khan.co.kr), 무단전재 및 재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
