고스톱, 많이 쳐본 AI가 백전백승…"광박, 피박, 쓰리고에 흔들었으니…"

AI타임스 원문
입력

2021.09.19 10:52

주소복사가 완료되었습니다

영화 '타짜'에서 전문도박사로 등장하는 배우 조승우의 모습. (사진=CJ 엔터테인먼트).

<이미지를 클릭하시면 크게 보실 수 있습니다>

영화 '타짜'에서 전문도박사로 등장하는 배우 조승우의 모습. (사진=CJ 엔터테인먼트).#1 추석을 맞아 본가로 내려간 정 대리. 가족들과 담소를 나누고, 저녁 식사도 함께 했다. 정 대리는 오랜만에 만난 친척들과 재미 삼아 고스톱을 쳤다. 명절 때만 치는 고스톱이라 잘할리는 만무하다. 나름 승부욕이 있는 정 대리는 이런 생각을 해본다. "요즘은 바둑도 알파고 등 AI에게 배운다던데, 인공지능으로 고스톱도 배울 수 없을까?"

#2 광주 동구에서 슈퍼를 운영하는 김 사장. 취미는 영업이 끝난 후 상가 입주 상인들과의 고스톱 한 판이다. 판이 무르익을 때 즈음, 옆집 세탁소 주인이 김 사장 옆으로 슬쩍 앉는다. 훈수를 두러 온 것. 세탁소 주인은 김 사장에게 귓속말로 "지금은 국진을 먹어야 돼, 다이아몬스(보너스패)는 아직 아니여"라고 속삭인다. 김 사장은 이럴 때마다 어떤 패를 내야 승률이 높을지 확인해 보고 싶은 마음이 굴뚝같다고 한다.

영화 타짜2에서 전문도박사로 출연하는 배우 신세경. (사진=롯데엔터테인먼트).

"광 4점, 고도리 5점, 멍텅구리 3점, 띠 1점, 피 12점, 쓰리고 3점, 합계 28점,
흔들기 2배, 역고 따따블 224점, 피박 448점, 광박 896점 멍박 1792점 쓰리고 3584점, 조사장님은 광박을 면했으니까 1792점, 더하면 총 5376점. 인정하시겠어요?"

영화 '타짜2'를 본 이라면 잊지 못하는 대사이다. 극중 배우들은 전문도박사다. 아울러 순서를 맞춘 화투패인 '탄'과 손기술로 얻어낸 점수다. 이를 본 관객들은 "실제로 가능하겠어?"라는 물음을 던진다. 2016년 이후 해당 영화를 본 관객들의 의문은 달라졌다. "이세돌을 꺾는 알파고도 나왔는데, 고스톱 잘 치는 AI라면 가능하지 않을까"

NHN측은 바둑 AI 한돌을 만든 회사이다. 몇 년전부터 AI 고스톱도 개발하고 있다. AI 타짜를 만든 배경에 대해 한 관계자가 설명하고 있다. (사진=NHN Cloud 공식 유튜브).

<이미지를 클릭하시면 크게 보실 수 있습니다>

NHN측은 바둑 AI 한돌을 만든 회사이다. 몇 년전부터 AI 고스톱도 개발하고 있다. AI 타짜를 만든 배경에 대해 한 관계자가 설명하고 있다. (사진=NHN Cloud 공식 유튜브). ◆ 고스톱 치는 AI 존재할까
바둑 AI '한돌'을 개발한 NHN이 몇 년전부터 고스톱 AI를 개발하고 있다. NHN은 한돌에 적용한 AI 기술을 고스톱에 적용했다. 한 수씩 두는 바둑과 패를 하나씩 내는 고스톱의 진행 방식은 얼핏 유사하게 보인다. 그러나 고스톱은 바둑과 장기와 달리 상대의 패를 볼 수 없는 완전하지 않은 정보를 포함하고 있고, 손 패와 뒤집는 패 등이 무작위로 정해지는 특성이 있어, 이러한 특성을 반영해 개발하고 있다.

자세히 소개하자면 NHN은 맞고 AI에 중점을 두고 있다. 완성도를 높이기 위함이다. 3인용 게임인 고스톱보다 1대1 게임인 맞고를 치는 AI 개발이 변수를 줄이기 용이하다는 것이다. 고스톱의 경우 한 플레이어가 고를 외치면 다른 플레이어들에게 일종의 '공공의 적'이 된다. 그러나 맞고에서는 서로 상황을 밀어주거나 협업할 수 있는 요소를 고려하지 않아도 되기 때문으로 보인다.

이들의 목표는 일반적으로 잘 친다는 사람의 수준, 또는 그 이상의 맞고에 능숙한 AI를 만드는 것이었다. 이를 위해 일반 사람들의 게임 기록을 모았다. NHN은 한게임이라는 게임 플랫폼을 보유하고 있기 때문에 기록 수집이 가능했다. 게임 내 패를 내는 패턴을 따라하는 '지도학습 모델'을 만들었다. 이는 바둑 AI 한돌의 모델을 설계했을 때처럼 딥러닝 기술에 기반한 지도학습 모델을 설계했다.

AI 고스톱이 가상의 플레이어와 대전을 펼치고 있는 모습. (사진=NHN Cloud 공식 유튜브).

모든 정보를 공개하고 대국에 임하는 바둑과 달리, 고스톱과 맞고는 뒤집을 패를 예상할 수 없다. 이를 염두해 경우의 수를 계산했다는 게 NHN 측의 설명이다. (사진=NHN Cloud 공식 유튜브).

<이미지를 클릭하시면 크게 보실 수 있습니다>

모든 정보를 공개하고 대국에 임하는 바둑과 달리, 고스톱과 맞고는 뒤집을 패를 예상할 수 없다. 이를 염두해 경우의 수를 계산했다는 게 NHN 측의 설명이다. (사진=NHN Cloud 공식 유튜브). ◆ "손기술? 필요없어요" 게임 기록 많이 보고, 배운 AI가 타짜
NHN은 개발 과정에서 몇 가지 실험을 하면서 완성도를 높였다. 중점적으로 개발한 AI 지도학습 모델과 아무 패나 무작위로 내는 AI, 사람들이 좋다고 생각하는 패를 학습한 AI 등 세 가지 모델을 각각 대전을 통해 교차 검증했다. 한 실험 당 1만 판 이상을 시뮬레이션했다. 이러한 대전 관련 AI 모델의 경우 바둑은 400판 정도의 시합이면 충분히 검증되지만, 고스톱은 변수가 많고 운이 크게 작용하기 때문에 기본 1만 판 이상 진행했다고 한다.

평가 지표는 누적 점수로 선정했다. 한 쪽의 게임 머니가 전부 떨어질 때까지 연이어 붙는 포커와 고스톱은 운과 심리전이 가미되기 때문에 점수로 평가하는 것이 가장 좋은 척도라는 게 NHN측의 설명이다. 일반 사람들의 데이터를 학습한 지도학습 모델이 가장 승률이 높았다. 나름대로 고스톱을 잘 친다는 사람들과 모의 대전도 진행했다. "굉장히 높은 수준"이라는 후한 평가도 받았다.

경기도 안양시 만안구 늘푸른경로당에서 오랜만에 만난 어르신들이 화투를 치며 즐거운 시간을 보내고 있다. (사진=뉴스1 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>

경기도 안양시 만안구 늘푸른경로당에서 오랜만에 만난 어르신들이 화투를 치며 즐거운 시간을 보내고 있다. (사진=뉴스1 제공).◆ '고수들의 게임 기록 학습한 AI VS 자가 대국으로 학습한 AI' 승자는?
지도학습 모델을 개발할 때는 몇 가지 조건이 있다. 값비싼 데이터와 데이터 가공 시간이 필요하다는 점이다. 연구팀은 이 같은 모델 자체의 한계를 극복하고자 했다. 이에 강화학습을 사용한 AI를 개발키로 했다. AI끼리 자가대국을 통해 생성한 게임 기록을 스스로 학습하는 방식이다. 연구팀은 강화학습 AI 고스톱 모델이 스스로 자가대전을 통해 인간의 한계를 뛰어넘는 실력을 가질 수 있을 것이라 내다봤다.

연구팀은 바둑 AI 한돌의 후속작격인 '한스톱'을 개발했다. 그렇다면 사람들의 게임 기록을 학습한 지도학습 모델과 자가대국을 통해 학습하는 강화학습 AI 모델과 겨룰 시 누가 승자일까. 답은 강화학습 AI 모델의 승리다. 강화학습 AI 모델은 어떤 패를 내는 것이 최적의 카드인지 알 수 있고, 모든 경우의 수를 찾고 승률이 가장 좋은 패를 찾아냈다는 것. 1만 판 기준 1판당 0.4점을 더 냈다고 한다.

박근한 NHN 기술연구센터 이사는 지난해 12월 NHN FORWARD 2020에서 "AI 한돌 기술을 다양한 게임에 적용했다"며 "고스톱 AI도 한돌처럼 각 상황별 패의 승률을 파악할 수 있는 수준이다. 이를 기반으로 상대자가 없을 때 재미있게 대전할 수 있는 로봇 AI 등의 서비스로 확대 가능하다"고 밝혔다.

AI타임스 유형동 기자 yhd@aitimes.com

Copyright ⓒ '인공지능 전문미디어' AI타임스 (http://aitimes.com)

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

이슈검색어

04.16 (화)

고스톱, 많이 쳐본 AI가 백전백승…"광박, 피박, 쓰리고에 흔들었으니…"

AI타임스 주요 뉴스