'챗GPT-4o 이미지 생성 모델' 공개…텍스트·이미지 첫 결합 모델
오픈AI는 이날부터 '챗GPT-4o(포오) 이미지 생성(ChatGPT-4o Image Generation)' 모델을 출시한다고 밝혔다. 새로운 모델은 오픈AI 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델이다.
가브리엘 고 오픈AI 멀티모달 담당은 "텍스트에 대한 지능을 가진 GPT-4 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다"고 설명했다.
이용자가 앞서 DALL-E를 통해 원하는 이미지를 만들기 위해서는 프롬프트를 하나하나 입력해야 했다. 하지만 새 모델은 이용자 의도를 파악해 이미지를 생성하며 복잡한 요청도 쉽게 수행한다는 특장점이 있다.
기존 AI 이미지 생성 모델들은 훈련되지 않은 데이터에 취약했다. 단순한 자전거 이미지는 잘 생성하지만 '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 어려움을 겪었다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
자연법칙에 관한 이미지도 쉽게 만들어낸다. 무지개를 정의하는 '뉴턴의 프리즘 실험'에 관한 이미지를 간단한 설명과 함께 생성해 달라고 하면 문구가 들어간 이미지가 보기 쉽게 생성된다.
오픈AI 측은 "챗GPT-4o 이미지 생성 모델이 이미지를 만들어 낸다는 점에서 기존 달리의 업그레이드 버전이긴 하나, 두 모델 기반 기술이 완전히 다르고 다양한 개선이 이뤄졌다"고 말했다.
이번 모델은 한국어로도 이미지 생성이 가능하다. 이날부터 '챗GPT 프로' 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.