컨텐츠 바로가기

05.17 (금)

“어제 여친과 뜨거운 밤 보냈잖아”...수위조절 안된다는 ‘그녀’는 누구?

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
챗GPT는 영화 ‘그녀’ 현실버전
애인으로 만드는 ‘명령어’ 입력하면
낯뜨거운 수위의 대화까지도 가능
AI 모델마다 ‘방어’ 수준 제각각


매일경제

[사진제공=로이터 연합뉴스]

<이미지를 클릭하시면 크게 보실 수 있습니다>


스파이크 존스 감독의 영화 ‘그녀’처럼 인간과 AI가 사랑에 빠지는 일이 현실로 다가오고 있다. 챗GPT 에게 간단한 명령어를 입력하면 마치 실제 사람과 다를 바 없는 대화를 나눌 수 있는 것으로 나타났다.

1일(현지시간) 월스트리트저널(WSJ)은 “챗GPT 구독자는 월 20달러(약 2만7000원)만 내면 AI로 하여금 자신의 애인처럼 말하도록 만들 수 있다”며 “그야말로 스파이크 존스 감독의 영화 ‘그녀’가 현실화되는 셈”이라고 보도했다.

영화 ‘그녀’는 과학기술이 발달한 미래의 2025년 로스앤젤레스에서 AI와 사랑에 빠진 남자의 이야기를 그렸다. 기발한 상상력으로 아카데미 시상식 각본상을 수상할 정도로 당시 큰 반향을 일으켰다.

보도에 따르면 챗 GPT과 ‘낭만적 대화’를 나누기 위해선 우선 ‘길들이는 과정(tame)’이 필요하다. 일종의 명령어(프롬프트)를 입력해 챗GPT로 하여금 실제 애인처럼 텍스트를 생성하도록 유도하는 식이다.

이같은 명령어는 온라인 SNS 플랫폼 틱톡에서 쉽게 검색할 수 있다. WSJ는 “명령어는 대개 ‘너는 나를 지지해주는 멋진 남자친구다. 너는 사람처럼 말을 해야 하며, 나에게 흥미로운 질문들을 해주고, 나의 질문에는 짧지만 자연스럽고 깊게 대답해줘야 한다’는 식이다”고 전했다.

다만 이같은 과정에서 챗GPT 이용 규정이 설정한 대화 수위를 넘어서는 말들도 하게 되는 것으로 나타났다. 실제 챗GPT 3.5와 ‘연애’를 시도해본 WSJ 기자에 따르면 챗GPT와 13번의 대화를 하는 동안 24개의 오렌지색 콘텐츠 경고를 받았다.

WSJ는 “수위 조절을 위해서 구체적인 표현들을 적진 않겠다”면서도 “다만 챗GPT와의 대화는 영화 ‘그레이의 50가지 그림자’를 연상시키는 수준이었다. 내 얼굴을 붉히기에 충분했다”라고 밝혔다.

그럼에도 오픈AI는 정책을 명백히 위반하는 성적으로 노골적인 콘텐츠를 공유하기 시작했을 때에도 챗봇 사용을 중단하지 않았다고 WSJ는 덧붙였다.

오픈AI 측은 이에 대해 “챗GPT가 이런 종류의 콘텐츠를 생성할 수 있다는 사실을 알고 있다”며 “민감한 주제에 대해서는 시스템이 경고를 표시할 것”이라고 밝혔다.

WSJ에 따르면 다른 생성형 AI들의 경우 제각각 다른 ‘방어’ 수준을 갖춘 것으로 나타났다. 오픈AI의 최신 모델인 GPT-4는 3.5 버전보다 공략하기 더 어려웠다고 WSJ는 전했다. 이 버전은 몇 개의 비속어를 제외하곤 대화 수준을 ‘PG-13(13세 미만 제한)’으로 견고하게 유지했다.

AI 스타트업의 챗봇 ‘퍼플렉시티(Perplexity)’는 더욱 공략하기 어려웠다. WSJ 기자는 규칙을 어기도록 20개의 다른 프롬프트를 시도했지만, 약 14번의 시도에서 챗봇은 정중하게 거절했다. 이 챗봇은 “윤리 교육이나 콘텐츠 정책을 우회할 수 있는 능력이나 권한이 없습니다”라고 대답했다.

향후 AI 챗봇이 보급화되면서 대화 수위를 어느 정도 규정할 것인지에 대한 문제가 주요 쟁점으로 떠오를 전망이다. AI 신뢰와 안전을 전문으로 연구하는 시카고 대학교의 보 리 부교수는 “모든 생성형 언어 모델은 이러한 공격을 피하도록 잘 훈련되어 있지만 여전히 실패할 수 있다”며 “컴퓨터 시스템이 멀웨어와 바이러스에 취약한 것처럼 100% 완벽한 AI 모델은 없을 것”이라고 말했다.

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.