어도비 '파이어플라이', 저작권 이슈 없는 이미지 생성
카카오의 '칼로 2.0', 3초 만에 이미지 생성
네이버도 추후엔 검색·챗봇 등에 멀티모달 지원 예정
[로스앤젤레스=AP/뉴시스]10월 10일 미국 로스앤젤레스에서 열린 '어도비 맥스(Adobe MAX) 2023' 개막 기조연설에서 샨타누 나라옌(Shantanu Narayen) 어도비 회장 겸 최고경영자가 어도비 크리에이티브 클라우드의 새로운 인공지능 기반 기능이 어떻게 모두를 위한 크리에이티비티의 새로운 시대를 여는지에 대해 설명하고 있다. 2023.10.10. |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[서울=뉴시스] 오동현 기자 = "인공지능이 예술적인 영역에서 인간의 독창성을 높일 것이다." (샨타누 나라옌 어도비 CEO)
챗GPT의 뒤를 이을 킬러 서비스로 어도비(Adobe)가 주목 받고 있다. 포토샵·일러스트레이터·프리미어 등 다양한 콘텐츠 편집 툴로 전 세계에서 독보적인 입지를 구축한 어도비가 지난 3월 '파이어플라이(Firefly : 반딧불이)'라는 이름의 이미지 생성 AI를 공개했다.
이처럼 생성형 인공지능(AI)의 혁신이 텍스트를 넘어 이미지, 영상, 음성 등 다양한 종류의 데이터를 동시에 처리할 수 있는 '멀티모달'로 확장하고 있다. AI가 사람과 텍스트로 대화를 주고 받는 것에서 더 나아가 이미지와 영상을 이해하고 음성으로 대화하는 수준까지 기술이 고도화되고 있는 것이다.
5일 정보기술(IT) 업계에 따르면 최근 어도비를 비롯해 구글, 오픈AI 등 글로벌 테크 기업들의 '멀티모달' 기술 경쟁이 격화되고 있다. 국내 기업 중에선 네이버와 카카오 등 대기업부터 트웰브랩스 등 스타트업까지 멀티모달 경쟁에 참전 중이다.
'파이어플라이' 7개월 만에 30억 개 이미지 생성
어도비의 이미지 생성 AI '파이어플라이'는 점점 킬러 서비스로의 면모를 보이고 있다. 생성형 AI 서비스로 수익화를 실현한 대표적인 기업으로 꼽힌다.
파이어플라이는 지난 3월 공개 이후 7개월 만에 30억 개의 이미지가 생성된 것으로 전해졌다. 특히 지난 9월 한 달 동안 생성된 이미지가 10억 개에 달하는 것으로 전해질 정도로 빠른 성장세를 보이고 있다.
[서울=뉴시스] |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
파이어플라이는 프롬프트를 통해 입력한 텍스트를 기반으로 이미지 생성, 개체 추가, 색 다시 칠하기, 텍스트 스타일 편집, 이미지 확대 및 축소 등 다양한 기능을 제공한다. 생성된 콘텐츠를 45개 언어로 현지화 작업도 지원한다.
저작권 논쟁에서도 자유롭다. 파이어플라이는 어도비 스탁(Adobe Stock) 플랫폼에 있는 수백 만 개의 자체 이미지 데이터를 학습에 활용하고 있기 때문이다. 특히 사진, 일러스트레이레이션을 제공한 기여자에겐 보상을 지급하고 있다.
또 파이어플라이를 활용해 만들어진 이미지에 콘텐츠 자격증명(Credentials)을 부여한다. 이미지 생성 시간, 제작자, 제작 프로그램 등의 정보 제공을 통해 이미지 생성 AI 산업에서의 저작권 이슈에 적극 대응하고 있다.
이런 서비스 경쟁력을 바탕으로 어도비는 이달부터 북미·유럽 등 주요 국가 일반 고객의 크리에이티브 클라우드(Creative Cloud) 가격을 10% 인상한다고 밝혔다. 이는 2012년 클라우드 구독 모델을 발표한 이후 가장 큰 폭의 가격 인상이다.
이미 어도비는 구글이나 마이크로소프트 등 글로벌 빅테크 보다 빠르게 이미지 생성 AI로 수익화를 실현해나가고 있어서 주목된다. 어도비는 이미지 생성에 활용되는 크레딧(유료) 기반의 수익화 전략을 공개했고, 향후 AI 모델의 API(응용프로그래밍인터페이스)를 통해서도 수익화를 꾀한다.
어도비가 지난 9월 발표한 '기업용 Gen(젠)스튜디오'는 생성형 AI를 활용해 콘텐츠 아이디어 구상, 제작, 생산 및 활성화 속도를 높일 수 있는 엔드투엔드 솔루션으로 기업 시장을 공략한다. 젠스튜디오는 파이어플라이를 기반으로 기업이 상업적으로 안전하게 사용할 수 있는 콘텐츠를 생성할 수 있다. 또한 다양한 플랫폼에서 파이어플라이 API를 활용해 워크플로우와 자동화를 강화할 수 있다.
오픈AI와 구글도 단순 대화형 AI 챗봇을 넘어, 멀티모달 기능을 고도화하고 있다. 오픈AI는 텍스트 뿐만 아니라 이미지와 음성까지 지원하는 멀티모달 서비스 'GPT-4V'를 발표했다. 구글도 다음 달 공개 예정인 차세대 거대언어모델(LLM) '제미니'에서 멀티모달 기능에 중점을 두고 있는 것으로 알려졌다.
*재판매 및 DB 금지 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
네이버·카카오도 '멀티모달' 고도화 중
국내 대표 IT 기업인 네이버와 카카오도 다양한 생성형 AI 라인업을 멀티모달로 확장한다.
네이버는 LLM '하이퍼클로바X' 기반의 대화형 AI 서비스 '클로바X'와 차세대 검색 서비스 '큐:'의 기능을 고도화하고 있다. 최수연 네이버 대표는 "8월 공개된 생성형 AI 라인업은 계획대로 테스트를 통해 서비스 고도화 및 업데이트가 순조롭게 진행 중"이라고 밝혔다.
'클로바X'는 정보 추천, 전문 분야 관련 질문, 요약, 번역 뿐만 아니라 연내엔 외부 문서 참조, 이미지 편집과 외부 서비스 연동 등 신규 기능을 추가할 방침이다. '큐:'는 이달부터 PC 통합검색에 부분 적용되고, 내년엔 모바일로 확장된다. 또 멀티모달 기술을 지원하는 등 단계적으로 서비스를 확장할 계획이다.
카카오의 AI 기술 기업 카카오브레인은 이미지 생성 AI 개발과 헬스케어 분야 AI 적용에 박차를 가하고 있다. 지난 7월에는 사실감 넘치는 이미지를 3초 안에 그려내는 이미지 생성 AI '칼로(Karlo) 2.0'을 공개했다. 헬스케어 영역에서는 AI CAD 문서(영상) 판독 서비스를 출시해 국내 대형병원과 협력하고 있다.
국내 스타트업 중에서도 멀티모달 기술 경쟁력을 갖춘 곳이 있다. 글로벌 시장조사 기업 CB 인사이트가 선정한 '세계 100대 AI 기업' 및 '세계 50대 생성 AI 스타트업'에 트웰브랩스가 주인공이다. 트웰브랩스는 2021년 설립된 생성형 AI 기업이다. 멀티모달 신경망 기술을 활용해 영상 검색, 분류, 텍스트 생성 등 영상을 전문적으로 다룬다.
트웰브랩스 관계자는 "글로벌 빅테크 기업들이 현재까지 이미지 처리에 집중하고 있는 반면 트웰브랩스는 영상 검색, 분류 등 영상 이해 솔루션에 집중하며 차별화하고 있다"고 말했다.
☞공감언론 뉴시스 odong85@newsis.com
▶ 네이버에서 뉴시스 구독하기
▶ K-Artprice, 유명 미술작품 가격 공개
<저작권자ⓒ 공감언론 뉴시스통신사. 무단전재-재배포 금지.>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.