컨텐츠 바로가기

03.28 (금)

'달리' 보다 더 똑똑한 '챗GPT이미지' 나온다, 삼각 바퀴 자전거도 척척

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
오픈AI 기존의 이미지 생성 AI 모델 '달리(DALL-E)3' 대체하는
새로운 모델 '챗GPT 4o 이미지 제네레이션' 선보여
복잡하고 비상식적인 지시 이해
'달리' 보다 자연스러운 이미지 구현
한국어로도 이용가능


파이낸셜뉴스

오픈AI의 새로운 이미지 생성 인공지능(AI) 모델 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation)이 물리학자 뉴턴의 '스펙트럼 이론'을 정확한 설명과 색으로 생성했다. 오픈AI 제공


파이낸셜뉴스

오픈AI의 새로운 이미지 생성 인공지능(AI) 모델 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation)이 물리학자 뉴턴의 '스펙트럼 이론'을 생성한 이미지를 활용해 또 다시 새롭게 생성한 이미지. 오픈AI 제공


파이낸셜뉴스

오픈AI의 새로운 이미지 생성 인공지능(AI) 모델 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation)이 물리학자 뉴턴의 '스펙트럼 이론'의 생성한 이미지를 활용해 또 다시 새롭게 생성한 이미지. 오픈AI 제공


【실리콘밸리=홍창기 특파원】

오픈AI가 자사 이미지 생성 인공지능(AI) 모델 '달리'(DALL-E)3 을 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation·이하 챗GPT 이미지)로 대체한다. '챗GPT 이미지'는 오픈AI의 생성형 AI 모델 'GPT-4'의 텍스트 이해 능력과 고급 이미지 생성 기능이 탑재돼 작용한다. 때문에 '챗GPT이미지'는 '달리3'보다 훨씬 더 복잡하고 까다로운 이용자가 원하는 정확한 이미지를 생성할 수 있다.

사용자가 원하는 복잡한 이미지 그대로 생성

오픈AI는 25일(현지시간) 한국 특파원들과 브리핑을 갖고 '챗GPT이미지'를 새롭게 선보인다고 발표했다. 오픈AI는'챗GPT이미지'는 지난 2023년 9월에 공개된 '달리'3 이후 1년 6개월 만에 오픈AI가 새롭게 선보이는 이미지 생성 AI 모델이다. 구체적인 프롬프트를 일일이 입력해도 '달리3'은 사용자의 니즈를 100% 반영하지 못해 그동안 업그레이드 필요성이 제기돼 왔는데 '챗GPT이미지'는 '달리3'보다 기능이 크게 진보했다는 것이 오픈AI의 설명이다.

오픈AI는 지난 2021년 1월 달리를 처음 출시했고 지난 2022년 4월 개선된 '달리 2'를 내놓은 후 지속적으로 이미지 생성 AI를 업그레이드하는 중이다. 오픈AI는 '챗GPT이미지'가 '달리3'를 완전히 대체한다고 설명했다. 다만 '달리3'에 익숙한 이용자를 위해 '달리3' 서비스는 시간을 두고 중지딘다.

오픈AI에서 멀티모달(Multimodal·텍스트, 이미지, 오디오 동시처리) 업무를 담당하고 있는 직원 가브리엘 고는 "'챗GPT이미지'는 '달리'3의 업그레이드 버전이 아닌 완전히 다른 이미지 생성 AI 모델이다"라고 강조했다. '챗GPT이미지'가 오픈AI의 이미지 생성 AI 모델이 참신함에서 실용적으로 전환시킨다는 설명이다.

특히 사용자의 복잡한 다단계 지시를 따르는 것이 가장 큰 장점이다. 사용자가 '파란색 별과 빨간색 삼각형'이라는 프롬프트를 챗GPT에 입력하면 '챗GPT이미지'가 이 객체의 속성을 올바르게 반영해 사용자가 원하는 정확한 이미지를 만들어내는 식이다.

오픈AI는 "'챗GPT이미지'를 테스트한 결과 이 모델은 최대 15가지의 사용자가 원하는 물체를 정확하게 생성할 수 있는 것으로 나타났다"고 설명했다. 이어 "이는 기존 모델인 '달리3'의 성능을 능가하는 것이다"고 덧붙였다.

파이낸셜뉴스

오픈AI의 새로운 이미지 생성 인공지능(AI) 모델 '챗GPT 4o(오) 이미지 제네레이션'(ChatGPT 4o Image Generation)이 사용자가 원하는 최대 15가지의 사용자가 원하는 물체를 정확히 그려냈다. 오픈AI 제공


효과적인 교육자료 만드는데도 손색없어

'챗GPT이미지'는 '달리3'과 달리 상식에서 벗어난 이미지 생성에서도 어려움을 겪지 않는다.

오픈AI에서 멀티모달 업무를 담당하는 또 다른 직원 재키 새넌은 "'챗GPT이미지'는 삼각형 바퀴가 달린 자전거를 그려달라는 프롬프트가 입력되면 '달리3'처럼 버벅되지 않고 삼각형 바퀴가 달린 이미지를 바로 생성해 낸다"고 설명했다. 또 정확한 텍스트와 캐릭터 배치를 활용해 네컷 만화를 생성하고 물리학자 뉴턴의 기존 프리즘 실험 이미지도 다양하게 활용해 새로운 이미지를 만들어 낸다.

때문에 오픈AI는 '챗GPT이미지'의 뛰어난 기능이 교육 자료나 그래픽 자료로 유용하게 활용될 수 있을 것이라고 기대했다. 이와 관련, '챗GPT이미지'는 교육용 포스터를 위한 푸른색의 대왕고래 등 8가지의 종류의 고래를 색이 틀리지 않게 올바르게 생성해냈다.

새넌은 "챗GPT 이미지로 AI는 단순히 재미있는 특수효과를 만들어 내지 않고 실용적인 도구가 될 것이다"라고 내다봤다. 이어 "오픈AI가 누구나 쉽고 자세하고 정확한 시각 자료를 만들 수 있는 가능성을 열어서 기쁘다"라고 덧붙였다.

'챗GPT이미지'는 오픈AI 이용자라면 누구나 무료로 챗GPT를 통해 사용할 수 있다. 또 오픈AI의 동영상 생성 AI 모델 소라(Sora)에서도 '챗GTP이미지'가 활용된다. '챗GPT이미지'는 한국어에도 응답한다. 다만 영어처럼 한국어로도 '챗GPT이미자'가 잘 작동할 지는 미지수다. 오픈AI측은 "앞으로 한국어 등 다른 언어로도 '챗GPT이미지'가 정확하게 작동할 수 있도록 업데이트 해 날 것"이라고 전했다.

theveryfirst@fnnews.com 홍창기 기자

Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.