컨텐츠 바로가기

    02.24 (화)

    이슈 IT기업 이모저모

    구글, AI 벤치마크 게임 아레나에 신규 게임 추가…마피아·포커 포함

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다
    [AI리포터]
    디지털투데이

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [디지털투데이 AI리포터] 구글이 AI의 전략적 사고를 검증하기 위해 포커와 마피아 게임을 공식 테스트 항목에 추가했다고 3일(이하 현지시간) 온라인 매체 기가진이 전했다.

    AI의 게임 성능을 측정하는 게임 아레나는 2025년부터 구글 딥마인드와 캐글이 협력해 운영하는 벤치마크 플랫폼이다. 기존에는 체스만 포함됐지만, 현실 세계의 불확실성을 반영한 테스트가 필요하다는 판단에 따라 두 가지 게임이 추가됐다.

    마피아 게임은 자연어 기반 소셜 추론 게임으로, AI가 불완전한 정보 속에서 인간처럼 협상하고 의사소통할 수 있는지를 평가한다. 구글 딥마인드는 이를 통해 차세대 AI 어시스턴트의 소프트 스킬을 검증하고, AI가 사회적 상호작용에서 얼마나 신뢰할 수 있는지를 확인할 계획이다.

    포커는 마피아 게임과 유사한 불완전 정보 게임이지만, 리스크 관리와 확률 계산이 핵심이다. AI는 상대의 패턴을 분석하고, 최적의 전략을 선택해야 한다.

    현재 리더보드에서는 최신 AI 모델인 제미나이3 프로와 제미나이3 플래시가 체스와 마피아 게임 모두에서 최고 엘로 레이팅(Elo rating)을 기록 중이다. 구글 딥마인드는 이를 기반으로 AI 포커 대회를 개최했으며, 최종 결과는 4일 공개될 예정이다.

    <저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.