컨텐츠 바로가기

03.28 (금)

오픈AI, 텍스트·이미지 통합한 새 AI 이미지 생성 모델 공개

0
댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
조선비즈

오픈AI 새 이미지 모델이 생성한 '뉴턴의 프리즘 실험'/오픈AI 제공



챗GPT 개발사 오픈AI가 기존 이미지 생성 AI보다 더 정교하고 직관적인 새로운 이미지 생성 모델을 25일(현지시각) 공개했다. 이 모델은 텍스트와 이미지를 통합한 첫 번째 모델로, 복잡한 요청도 이해하고 이용자의 의도를 반영해 이미지를 생성하는 것이 특징이다.

오픈AI는 이번에 출시한 ‘챗GPT-4o 이미지 생성’(ChatGPT-4o Image Generation) 모델이 텍스트 기반 언어 지능을 가진 GPT-4와 이미지 생성 기능을 결합한 모델이라고 밝혔다. 오픈AI는 이를 통해 텍스트의 의미를 깊이 이해하면서도 시각적으로 정교한 이미지를 만들어내는 AI를 구현했다고 설명했다.

기존 ‘달리’(DALL-E) 모델은 사용자가 원하는 이미지를 만들기 위해 프롬프트를 세밀하게 입력해야 했지만, 이번 모델은 간단한 지시만으로도 이용자의 의도를 파악해 복잡한 이미지도 쉽게 생성할 수 있다. 삼각형 바퀴를 가진 자전거처럼 기존 AI가 처리하기 어려웠던 이미지도 무리 없이 만들어낸다.

특히 텍스트 삽입 기능이 크게 개선돼, 다양한 고래의 종류를 포함한 포스터나 대사가 포함된 카툰 등도 정확히 표현할 수 있다. 기존 모델은 글씨가 깨지거나 객체와 텍스트 간의 관계를 제대로 이해하지 못하는 경우가 많았지만, 새 모델은 이 같은 한계를 극복했다는 평가다.

자연법칙을 설명하는 이미지나 수학 공식, 메뉴판, 비즈니스 로고 등도 요청만으로 쉽게 생성할 수 있으며, 투명 배경도 지원해 스티커 제작 등 실용적인 활용도 가능하다.

오픈AI는 이 모델이 기존 ‘달리’의 단순한 업그레이드가 아니라, 전혀 다른 기술 기반에서 개발된 만큼 기능과 성능 모두 대폭 개선됐다고 강조했다. 새 모델은 한국어를 포함한 다양한 언어를 지원하며, 챗GPT 프로 유료 이용자는 물론 무료 이용자도 사용할 수 있다.

이경탁 기자(kt87@chosunbiz.com)

<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.