‘챗GPT-4o 이미지 생성’ 모델을 통해 만들어낸 카툰. 오픈AI 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
오픈AI가 보다 쉽게 정교한 이미지를 만들 수 있는 이미지 생성 인공지능(AI) 모델을 공개했다.
오픈AI는 25일(현지시간) ‘챗GPT-4o 이미지 생성’ 모델을 출시했다고 밝혔다. 새 모델은 오픈AI의 멀티모달(텍스트·이미지·음성 등 복합 정보 처리) AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델이다. 텍스트와 이미지를 통합한 첫 모델이다.
오픈AI의 멀티모달 담당인 가브리엘 고는 “우리는 텍스트에 대한 지능을 가진 GPT-4의 강점과 최고의 이미지 생성 모델의 시각적 지능을 결합한 모델을 만들고자 했다”며 “이번 모델이 바로 그 목표를 달성한 결과물”이라고 말했다.
새 모델은 오픈AI의 기존 이미지 모델인 ‘달리’(DALL-E)보다 더 쉽고 정교하게 이미지를 생성한다고 오픈AI는 소개했다. 기존에는 이용자가 원하는 이미지를 위해 프롬프트를 하나하나 입력해야 했지만, 새 모델은 이용자의 의도를 파악해 이미지를 생성한다는 것이다.
‘챗GPT-4o 이미지 생성’ 모델을 통해 만들어낸 뉴턴의 프리즘 실험 이미지. 오픈AI 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
만화를 그려달라고 하면 사용자가 입력한 묘사와 대화가 들어간 4컷 카툰이 깔끔하게 생성되고, 메뉴판이나 수학 공식을 그려달라고 하면 한눈에 보기 쉽게 생성한다. ‘뉴턴의 프리즘 실험’과 같은 과학 지식에 관한 이미지도 직관적으로 만들어준다.
텍스트와 이미지 간 지식을 연결해 구체적인 정보가 담긴 이미지도 만들 수 있다. ‘다양한 종류의 고래를 교육 포스터로 만들어달라’는 요청에 고래의 종류와 이름을 정확히 매칭해 이미지를 생성해낸다.
다양한 종류의 고래를 교육 포스터로 만들어달라는 명령에 따라 만들어낸 이미지. 오픈AI 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
고양이 사진을 바탕으로 게임 캐릭터를 디자인하는 모습. 오픈AI 제공 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
기존 모델은 이런 객체 속성 관계를 잘 이해하지 못하고 글씨가 종종 깨지는 경우가 많았지만, 새 모델은 훨씬 더 복잡한 지시도 잘 수행하는 것으로 평가됐다. 또한 이미지 생성 과정에서 일관성이 향상되면서 게임 캐릭터 디자인과 같은 작업에서도 여러 차례 수정해도 기본 모습은 유지한 상태에서 변화를 주는 것이 가능해졌다.
새 모델은 한국어로도 이미지 생성이 가능하며 이날부터 챗GPT 프로 등 유료 가입자는 물론, 무료 가입자도 사용할 수 있다.
배문규 기자 sobbell@kyunghyang.com
▶ 매일 라이브 경향티비, 재밌고 효과빠른 시사 소화제!
▶ 주3일 10분 뉴스 완전 정복! 내 메일함에 점선면 구독
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.