컨텐츠 바로가기

    12.06 (토)

    이슈 모바일 게임 소식

    "게임 약점은 옛말?"…퀄컴 스냅드래곤 X2 GPU 아키텍처 전면 교체에 아드레노 X2 '환골탈태'

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다

    [스냅드래곤X딥다이브] 에릭 데머스 수석 부사장 "PC GPU 구조까지 완전 자립 선언"

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    [샌디에이고(미국)=디지털데일리 김문기기자] 11일(현지시간) 미국 샌디에이고 파라다이스 포인트 리조트에서 개최된 ‘스냅드래곤 X 아키텍처 딥다이브 2025’ 행사에서 퀄컴은 자사 설계 기반 GPU ‘아드레노(Adreno) X2’를 공식 공개했다. 무대에 오른 에릭 데머스 퀄컴 엔지니어링 수석부사장은 "아드레노 X2는 지금까지 우리가 만든 GPU 중 가장 크고, 가장 빠르며, 동시에 가장 효율적인 제품”이라고 확신했다.

    아드레노 X2는 스냅드래곤 X 시리즈의 그래픽 엔진으로, 전 세대(X1) 대비 평균 2.3배의 성능을 달성하고, 동일 성능 대비 전력 소비를 60% 줄였다. GPU 효율성은 125% 개선됐다. 데머스 수석 부사장은 “얇고 가벼운 노트북에서도 데스크톱급 그래픽 경험을 제공하는 것이 목표였다”며 “성능뿐 아니라 전력 효율까지 균형을 맞췄다”고 강조했다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    ‘슬라이스’로 구성된 모듈형 GPU 구조…연산 성능 33% 확대·1.85GHz 고클럭 달성

    아드레노 X2의 가장 큰 변화는 모듈화된 ‘슬라이스(Slice)’ 구조다. 슬라이스는 GPU 내부를 구성하는 기본 단위로, 프론트엔드(버텍스·프리미티브 처리), 셰이더 프로세서(SP), 텍스처 및 렌더 백엔드, 온칩 캐시까지 포함한 완전한 연산 블록이다.

    X2-90 모델은 총 네 개의 슬라이스로 구성된다. 각 슬라이스는 독립적으로 동작하면서도 전체 GPU의 병렬 연산에 기여한다. 설계 효율을 극대화하기 위해 퀄컴은 하나의 슬라이스를 완벽히 최적화한 뒤 이를 물리적으로 복제·배치하는 방식을 채택했다. 이는 설계 및 물리 구현 과정에서 시간과 비용을 크게 절감하는 동시에, 슬라이스 단위의 결함 격리 기능도 가능하게 했다. 특정 슬라이스에 결함이 발생해도 나머지 블록만으로 제품을 완성할 수 있는 구조적 유연성을 확보한 셈이다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    전 세대 대비 ALU(산술논리연산장치)와 백엔드 유닛 수를 약 33% 확장했다. 내부 SRAM(정적 메모리) 속도 향상과 함께 최대 1.85GHz의 클럭 주파수를 구현했다.

    총 4슬라이스 구성에서 2000개의 병렬 연산 유닛과 128개의 텍셀 필터링 유닛을 갖추고 있다. 최대 320GB/s의 메모리 대역폭을 지원한다. 한 사이클당 픽셀 렌더링은 64개, Z 버퍼 연산은 128개까지 처리할 수 있다.

    이는 퀄컴 GPU로서는 사상 최대 규모로, 모바일 중심의 아드레노 라인업을 PC급 성능으로 확장하는 핵심 기반이다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    ◆ 레이트레이싱 완전 하드웨어화…GPU 전용 HPM 메모리로 온칩 렌더링 시대 개막

    퀄컴은 아드레노 X2에서 레이트레이싱(Ray Tracing) 구조를 대폭 개편했다. X1이 최대 8개의 바운딩 박스(Bounding Box)나 4개의 삼각형 교차 연산을 수행할 수 있는 단일 RTU를 채택했다면 X2는 RTU를 16개로 늘려 병렬 연산 구조를 강화했다.

    또한 기존에는 셰이더가 처리하던 트리 탐색 작업을 전용 하드웨어로 이전해, 바운딩 볼륨 탐색 과정의 병목을 해소했다. 이로써 실시간 글로벌 일루미네이션이나 반사 효과 등 고부하 그래픽 처리에서도 안정적인 성능을 확보했다.

    데머스 수석 부사장은 “새로운 RTU 구조는 단순한 수적 확장이 아니라, 트리 탐색·교차 연산을 완전 병렬화한 아키텍처 전환”이라며 “통합형 GPU 환경에서의 레이트레이싱 효율을 크게 높였다”고 말했다.

    아드레노 X2는 GPU 내부에 고성능 전용 메모리 HPM(High Performance Memory)을 새롭게 탑재했다. 총 용량은 21MB다. 슬라이스당 5.25MB씩 배정된다. 이 메모리는 기존처럼 렌더링 데이터를 DRAM으로 전송하지 않고, GPU 내부에서 바로 저장·가공할 수 있게 한다. 퀄컴은 이를 통해 렌더링 중간 단계에서 최대 40%의 외부 대역폭을 절감했다고 밝혔다.

    그는 “GPU 내부에서 렌더링과 포스트 프로세싱을 모두 수행한 뒤, 완성된 이미지만 DRAM에 압축 저장하는 구조”라며 “지연 시간과 전력 소모를 모두 줄이면서 대규모 그래픽 연산에 유리한 구조”라고 설명했다.

    이는 모바일 시절의 타일 기반 렌더링(Tiled Rendering)을 발전시킨 개념이라고 볼 수 있다. PC용 통합 GPU에서도 실질적인 성능 향상을 이끌어낼 것으로 기대된다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    ◆ 다이렉트X 12.2 완전 대응…“성능만큼 중요한 건 효율”

    아드레노 X2는 최신 그래픽 API를 모두 지원한다. 다이렉트X 12.2 울티메이트의 모든 기능을 구현했고, 벌칸(Vulkan) 1.4, OpenCL 3.0, SYCL(시클) 지원도 순차 적용된다.

    메쉬 셰이딩(Mesh Shading), 가변 셰이딩(VRS), 샘플러 피드백(Sampler Feedback), XR 1.1 등도 지원한다. 마이크로소프트와 협업해 윈도우 온 ARM 환경에서의 호환성 문제를 개선했다.

    퀄컴은 드라이버 업데이트 주기를 기존 분기별에서 월 단위로 단축할 계획이다. ‘스냅드래곤 컨트롤 패널’이 X1과 X2 모두에서 활성화돼, 사용자는 실시간으로 GPU 드라이버 업데이트를 확인하고 설치할 수 있다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    이를 위해 퀄컴은 X1 대비 X2의 성능을 20여 개의 실제 게임 타이틀에서 검증했다. 툼 레이더 시리즈는 약 2.5배, 워해머: 토탈 워는 최대 4배의 성능 향상이 관측됐다. 게임별 편차는 존재하지만 평균적으로 2.3배의 향상폭을 기록했다는 설명이다.

    데머스 수석 부사장은 “개별 타이틀 최적화 작업은 거의 없었고, 대부분은 기본 상태에서의 결과”라며 “실제 OEM이 생산할 상용 제품에서는 더 높은 성능 여지를 남겨두고 있다”고 말했다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    한편, 아드레노 X2는 RISC 기반의 전력 관리 유닛 GMU(Graphics Management Unit)를 내장했다. GMU는 GPU 내부 온도와 누설 전류를 감지하고, 이를 실시간으로 모델링해 전압과 클록을 동적으로 조정한다.

    배터리 이벤트 발생 시에는 GPU 클록을 자동으로 낮추고, 작업이 완료되면 전체 GPU 전원을 차단해 대기 전력을 최소화한다. GMU는 또한 시스템 수준에서 CPU와 전력 정보를 교환하며, 플랫폼 전체의 전력 균형을 조율한다. 이러한 구조는 ‘올웨이즈 커넥티드 PC(Always Connected PC)’라는 퀄컴의 장기 전략에 맞춰, 장시간 배터리 수명과 즉시 대기 복귀를 동시에 달성하기 위한 설계다.

    디지털데일리

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    데머스 수석 부사장은 "아드레노 X2는 단순히 성능이 아닌 전력 효율의 새로운 기준을 제시하는 제품”이라며, “모바일 시대부터 쌓아온 효율 설계의 DNA를 PC 환경에서도 그대로 이어가고 있다. 이는 단순한 세대 교체가 아니라 퀄컴 GPU의 완전한 자립 선언”이라고 강조했다.

    - Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.