더애틀랜틱, AI검색 효과 분석
퍼블리셔 데이터 학습하는 구글 AI
“퍼블리셔 붕괴에 AI 개발 어려워질 것”
퍼블리셔 데이터 학습하는 구글 AI
“퍼블리셔 붕괴에 AI 개발 어려워질 것”
“시한 폭탄을 던진 구글”에 대한 상상도 (Created with DALLE-3) |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
생성형 인공지능을 탑재한 검색 엔진이 ‘웹 2.0’ 기반 비즈니스를 붕괴시킬 수 있다는 주장이 나왔다. 생성형 AI를 탑재한 검색 엔진은 챗봇 형태로 답변을 제공한다. 사용자가 묻는 질문에 답변이 있는 사이트 주소를 안내하지 않고, 답변을 생성하기 때문에 트래픽이 하락할 수 있다는 주장이다.
15일(현지 시각) 더애틀랜틱과 월스트리트저널에 따르면, 더애틀랜틱은 웹 트래픽의 약 40%는 구글 검색을 통해 발생하고 있다고 진단했다. 그러면서 구글의 AI 통합이 이뤄질 경우 트래픽이 감소할 위험이 있다는 모델링 결과를 발표했다. 더애틀랜틱 연구진은 구글을 통해 발생하는 트래픽의 약 20~40%가 손실될 것으로 전망했다. 현재 구글은 ‘검색 생성 경험’이라는 AI 제품을 테스트 중이며, 이를 조만간 검색 엔진에 통합할 계획이다. 구글은 챗GPT와 같은 챗봇의 인기 상승에 대응해, 검색 엔진을 재편하고자 한 것이다.
하지만 연구진은 구글의 AI 검색 엔진 도입으로 사용자가 퍼블리셔 사이트로 연결되는 링크를 클릭하지 않을 것으로 내다보고 있다. 주석을 통해 URL을 제시하더라도 이를 클릭할 가능성이 희박하다는 염려다. 이 같은 방식이 웹사이트 소유자에게 피해를 줄 수 있다는 것이다. 디지털미디어의 컨설턴트인 매튜 골드스타인은 “구글이 너무 많은 퍼블리셔를 죽이면 LLM을 구축할 수 없다”고 말했다. AI는 퍼블리셔 사이트 글을 학습 해야지만 성장하는데, AI를 검색 엔진에 부착하면 퍼블리셔 사이트가 붕괴될 수 있다는 설명이다. 실제로 구글의 AI 검색은 웹내 콘텐츠와 기타 자료로 학습됐다. 구글은 인터넷에 있는 모든 자료가 AI 모델 학습에 활용될 수 있다고 설명한다.
이에 대해 뉴스 코퍼레이션의 CEO 로버트 톰슨은 이미 AI에 대한 우려를 표명한 상태다. 또 마티아스 도프너 악셀스프링거 회장 겸 CEO는 “AI와 대규모 언어 모델이 저널리즘과 미디어 브랜드를 파괴할 수 있다”고 경고했다. 악셀스프링거는 앞서 오픈AI와 콘텐츠 라이선스 계약을 맺은 기업이다. 일부 퍼블리셔는 구글이나 다른 인공지능 회사가 허가 없이 콘텐츠를 스크랩할 권리에 대한 법적 문제에 집중하고 있다고 밝힌바 있다. IAC·익스피디아의 회장인 배리 딜러는 “퍼블리셔의 저작권이 침해되고 있다고 생각한다”고 말했다.
또 많은 퍼블리셔가 AI 도구가 콘텐츠를 크롤링하지 못하도록 웹사이트에 코드를 삽입하는 방법을 선택하고 있다. 하지만 이는 구글 검색 엔진에 의한 색인화와 충돌할 수 있다. 구글의 정책에 따라 퍼블리셔가 콘텐츠를 크롤링하지 않으면, 인터넷에서 찾기 어려울 수 있다는 암묵적인 위협이 있는 셈이다. 올 9월 구글은 퍼블리셔가 특정 구글 AI 도구에서 콘텐츠의 학습을 면제할 수 있는 새로운 도구인 ‘구글-익스텐디드(Google-Extended)’를 제공한다고 발표했다. 하지만 AI 기반 검색에 대해서는 적용되지 않는다.
하지만 구글은 AI 검색 도구 도입에 따른 트래픽 영향을 추정하는 것이 추측에 불과하다고 반박한다. 이에 대해 구글의 검색 엔진을 담당하는 부사장인 리즈 리드는 “회사가 웹 퍼블리셔로의 트래픽 유도를 위해 최선을 다하고 있다”면서 “AI 기반 검색 도구의 광범위한 출시 일정은 아직 밝히지 않았다”고 말했다. 현재 구글은 퍼블리셔를 위해 뉴스 기사 작성 및 발행에 도움이 될 수 있는 다양한 AI 도구를 공개하고 있다.
[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.