오픈AI, 더 똑똑해진 챗GPT 선보여…만화·자연법칙 이미지도 뚝딱

디지털데일리 원문
이나연 기자
입력

2025.03.26 09:59

주소복사가 완료되었습니다

'챗GPT-4o 이미지 생성 모델' 공개…텍스트·이미지 첫 결합 모델

[디지털데일리 이나연기자] 인공지능(AI) 챗봇 '챗GPT' 개발사 오픈AI가 이미지 생성 AI 모델을 25일(현지시간) 공개했다. 텍스트와 이미지를 통합한 첫 모델로서, 오픈AI의 기존 이미지 모델인 '달리(DALL-E)'보다 더 쉽고 정교하게 이미지를 생성한다.

오픈AI는 이날부터 '챗GPT-4o(포오) 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔다. 새로운 모델은 오픈AI 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델이다.

가브리엘 고 오픈AI 멀티모달 담당은 "텍스트에 대한 지능을 가진 GPT-4 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"고 설명했다.

이용자가 앞서 DALL-E를 통해 원하는 이미지를 만들기 위해서는 프롬프트를 하나하나 입력해야 했다. 하지만 새 모델은 이용자 의도를 파악해 이미지를 생성하며 복잡한 요청도 쉽게 수행한다는 특장점이 있다.

기존 AI 이미지 생성 모델들은 훈련되지 않은 데이터에 취약했다. 단순한 자전거 이미지는 잘 생성하지만 '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었다.

<이미지를 클릭하시면 크게 보실 수 있습니다>

오픈AI 측은 텍스트를 이미지에 정확히 삽입하는 기능이 크게 개선됐다고 강조했다. '여러 종류의 고래를 보여주는 포스터를 만들어 줘'라고 요청하면 고래 종류와 이름을 정확히 매칭해 생성한다.

기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨가 종종 깨지기도 했지만 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐다.

자연법칙에 관한 이미지도 쉽게 만들어낸다. 무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해 달라고 하면 문구가 들어간 이미지가 보기 쉽게 생성된다.

만화를 그려달라고 하면 대화가 들어간 카툰이 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성한다. 투명 배경도 지원해 강아지 스티커를 만들 때 투명 배경을 요청하면 이를 반영할 수 있고, 비즈니스 로고와 같은 이미지도 투명 배경으로 생성할 수 있다.

오픈AI 측은 "챗GPT-4o 이미지 생성 모델이 이미지를 만들어 낸다는 점에서 기존 달리의 업그레이드 버전이긴 하나, 두 모델 기반 기술이 완전히 다르고 다양한 개선이 이뤄졌다"고 말했다.

이번 모델은 한국어로도 이미지 생성이 가능하다. 이날부터 '챗GPT 프로' 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

전체 댓글 0

댓글 운영정책

당신의 생각을 남겨주세요

0 / 1000

로그인 후 댓글을 작성해 주세요

댓글 블라인드 기능으로 악성댓글을 가려보세요!

블라인드

OFF

뉴스

AI 이슈 트렌드

03.30 (일)

오픈AI, 더 똑똑해진 챗GPT 선보여…만화·자연법칙 이미지도 뚝딱

디지털데일리 주요 뉴스