컨텐츠 바로가기

    12.06 (토)

    이슈 모바일 게임 소식

    ‘얇고 가벼운 노트북에서 AAA 게임 오래’…퀄컴, ‘아드레노 X2’ GPU에 쏟아지는 질문

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다

    [스냅드래곤X딥다이브] 에릭 데머스 수석 부사장 "노트북에 들어간 퀄컴 DNA"

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>




    [샌디에이고(미국)=디지털데일리 김문기기자] “이번 GPU는 단순한 모바일 파생이 아니다. 윈도우 온 ARM을 위해 더 크고 더 빠르게, 완전히 새로 설계했다”

    에릭 데머스(Eric Demers) 퀄컴 엔지니어링 수석부사장과 데이브 던닐(Dave Durnil) 게임 겸 스냅드래곤 스튜디오 글로벌 총괄은 11일(현지시간) 미국 샌디에이고 파라다이스 포인트 리조트에서 개최된 ‘스냅드래곤 X 아키텍처 딥다이브 2025’ 행사에서 자사 설계 기반 GPU ‘아드레노(Adreno) X2’에 대해 이같이 말했다. 그는 "아드레노 X2는 지금까지 우리가 만든 GPU 중 가장 크고, 가장 빠르며, 동시에 가장 효율적인 제품”이라고 확신했다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>




    ◆ AI 업스케일링, GPU와 NPU의 경계 허문다

    데머스 수석 부사장은 데머스는 “우리는 언제나 성능과 효율 사이의 균형점을 찾는다. 이번엔 얇고 가벼운 노트북에서도 전력 10와트 수준에서 X1 대비 두 배 이상의 성능을 내도록 설계했다"고 강조했다. 퀄컴이 강조한 키워드 말 그대로 ‘성능대전력(Performance per Watt)’이었다.

    아드레노 X2는 최대 4슬라이스 구성(X290 기준)을 채택했다. 각 슬라이스는 버텍스·셰이더·텍스처·컬러 백엔드·HPM 인터페이스를 모두 포함한 독립형 GPU로 동작한다. 구조는 완전히 모듈화돼 슬라이스를 늘리거나 줄일 수 있다. 이전 세대 대비 RTU(레이 트레이싱 유닛)는 두 배 늘었고, 내부 연산은 '레이 대 8개 바운딩박스, 4개 트라이앵글 교차 판정'을 사이클 단위로 처리한다.

    데머스 수석 부사장은 “RT 트리 탐색의 푸시·팝까지 하드웨어화했다. 레이쿼리 기반 접근보다 훨씬 효율적”이라고 설명했다.

    온칩 메모리인 HPM(High Performance Memory)은 21MB 용량으로 확장됐다. 약 3MB는 순수 캐시로 쓰고 나머지는 드라이버와 소프트웨어가 제어한다. 그는 “프레임 전체를 온칩에서 처리한 뒤 외부로 압축 전송해 대역폭을 줄인다. 캐시이자 스크래치패드 역할을 병행한다”고 설명했다.

    GPU 내부에는 전용 AI 유닛이 없다. 대신 NPU와 GPU가 협업하는 구조다. 이에 대해서도 “NPU를 통한 슈퍼 레졸루션은 이미 윈도우에 내장돼 있다. 코파일럿 런타임의 벡터·매트릭스 연산은 GPU 벡터 유닛에 효율적으로 매핑된다”고 말했다.

    던닐 총괄은 “AI 기반과 비AI 기반 업스케일러 모두 지원하고, 서드파티 AI 솔루션도 통합 중”이라고 설명했다. 경쟁사의 DLSS와 유사한 기능이지만, GPU 내부보다는 NPU 연동을 우선하는 접근이다.

    GPU 면적이 CPU 클러스터보다 작다는 지적에는 “얇고 가벼운 노트북에서 성능·발열·비용을 모두 고려한 결과”라고 답했다. “더 큰 GPU를 넣을 수도 있었지만, 그만큼 비싸지고 제품군이 한정된다. 현재 구성은 시장과의 균형점”이라고 했다.

    슬라이스 확장성에 대해서는 “내부적으로 더 큰 버전도 모델링해봤다. 1~4슬라이스 구성은 물론, 저전력 IoT용 단일 슬라이스까지 대응할 수 있다. 이번 X2는 그중 최대형”이라고 덧붙였다.

    아드레노 X2는 FP32, FP16(필요 시 FP32 누산), DP4 형태의 INT8을 네이티브 지원한다. L2 캐시는 두 배로 확장됐으며, 슬라이스 간 인클루시브 구조다. 전력 관리는 GMU(Graphics Management Unit)가 담당한다. GMU는 온도·전압·활동도를 실시간 감시한다. 프레임이 끝나면 GPU 전원을 핀 레벨에서 끌 수 있다는 설명이다.

    또한 DX12U·벌칸(Vulkan) 1.4·OpenCL 3.0·다이렉트ML(Windows Copilot Runtime)을 모두 지원한다. 리눅스와 프로톤 환경과 관련해 그는 “드라이버·컴파일러가 OS에 독립적으로 구성돼 있어 동일하게 동작한다”고 말했다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    ◆ 윈도우 온 ARM 게이밍 최적화

    프리즘(Prism) 번역 레이어를 통한 실행 성능은 지속 반복된 질문이다. 던닐 총괄은 "에뮬레이션이라는 표현은 부정확하다. 운영체제와 DX 드라이버는 네이티브고, 번역되는 건 CPU 명령뿐이다. 실행 후 캐시되므로 성능 손실은 미미하다”고 선을 그었다.

    아울러 “공개한 수치들은 업스케일링을 끈 상태의 순수 성능이며, X2 엘리트에서 대부분의 타이틀이 1080p 미디엄 설정에서 60fps 이상을 낸다”고 강조했다. 현장 데모에서는 네이티브와 번역 실행을 병렬 비교하며, ARM64와 x86 혼합 배포 방식도 소개됐다.

    스냅드래곤 스튜디오는 2년 넘게 100곳 이상의 글로벌 개발사와 협력 중이다. 던닐 총괄은 “이지 안티치트(EAC), 배틀아이 등 주요 솔루션을 네이티브로 이식했고, 에픽 온라인 서비스와 포트나이트도 윈도우 온 스냅드래곤으로 들어왔다”고 설명했다.

    스팀·에픽게임즈 스토어·Xbox 게임패스 등 주요 스토어 역시 지원된다. 언리얼 엔진 5와 유니티는 네이티브 포팅이 완료됐다. 그는 “상위 1000개 게임을 지원하면 사실상 99%의 이용자를 커버한다”며 생태계 완성도를 강조했다.

    초기 버전에서 발견된 프레임 타임 하락(1%·0.1% Low)은 셰이더 JIT 컴파일러의 오버헤드가 원인이라는 지적도 따랐다. 데머스 수석 부사장은 “컴파일러를 경량화하고 캐시 매핑을 개선해 글리치를 없앴다. 9월 드라이버 이후 성능이 체감 수준으로 향상됐다”고 해명했다.

    한편, 드라이버 업데이트 주기도 분기 단위에서 월 단위로 단축된다. 그는 “가장 이상적인 건 게임 출시 전부터 우리 플랫폼에서 디버깅하는 것”이라며, “그 비중이 꾸준히 늘고 있다”고 말했다. 새로운 ‘스냅드래곤 컨트롤 패널’은 19일(현지시간) 공개된다. 앱별 프로파일 설정과 드라이버 업데이트를 통합 관리하는 도구로, GPU 소프트웨어 품질 관리의 일환이다.

    데머스 수석 부사장은 “우리는 늘 성능과 효율을 함께 본다. 더 큰 GPU를 만드는 건 쉽지만, 균형 잡힌 제품을 만드는 게 더 어렵다. 하지만 성능은 끝이 없다”고 마무리했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.