[스냅드래곤X딥다이브] 에릭 데머스 수석 부사장 "PC GPU 구조까지 완전 자립 선언"
<이미지를 클릭하시면 크게 보실 수 있습니다> |
아드레노 X2는 스냅드래곤 X 시리즈의 그래픽 엔진으로, 전 세대(X1) 대비 평균 2.3배의 성능을 달성하고, 동일 성능 대비 전력 소비를 60% 줄였다. GPU 효율성은 125% 개선됐다. 데머스 수석 부사장은 “얇고 가벼운 노트북에서도 데스크톱급 그래픽 경험을 제공하는 것이 목표였다”며 “성능뿐 아니라 전력 효율까지 균형을 맞췄다”고 강조했다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
아드레노 X2의 가장 큰 변화는 모듈화된 ‘슬라이스(Slice)’ 구조다. 슬라이스는 GPU 내부를 구성하는 기본 단위로, 프론트엔드(버텍스·프리미티브 처리), 셰이더 프로세서(SP), 텍스처 및 렌더 백엔드, 온칩 캐시까지 포함한 완전한 연산 블록이다.
X2-90 모델은 총 네 개의 슬라이스로 구성된다. 각 슬라이스는 독립적으로 동작하면서도 전체 GPU의 병렬 연산에 기여한다. 설계 효율을 극대화하기 위해 퀄컴은 하나의 슬라이스를 완벽히 최적화한 뒤 이를 물리적으로 복제·배치하는 방식을 채택했다. 이는 설계 및 물리 구현 과정에서 시간과 비용을 크게 절감하는 동시에, 슬라이스 단위의 결함 격리 기능도 가능하게 했다. 특정 슬라이스에 결함이 발생해도 나머지 블록만으로 제품을 완성할 수 있는 구조적 유연성을 확보한 셈이다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
총 4슬라이스 구성에서 2000개의 병렬 연산 유닛과 128개의 텍셀 필터링 유닛을 갖추고 있다. 최대 320GB/s의 메모리 대역폭을 지원한다. 한 사이클당 픽셀 렌더링은 64개, Z 버퍼 연산은 128개까지 처리할 수 있다.
이는 퀄컴 GPU로서는 사상 최대 규모로, 모바일 중심의 아드레노 라인업을 PC급 성능으로 확장하는 핵심 기반이다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
퀄컴은 아드레노 X2에서 레이트레이싱(Ray Tracing) 구조를 대폭 개편했다. X1이 최대 8개의 바운딩 박스(Bounding Box)나 4개의 삼각형 교차 연산을 수행할 수 있는 단일 RTU를 채택했다면 X2는 RTU를 16개로 늘려 병렬 연산 구조를 강화했다.
또한 기존에는 셰이더가 처리하던 트리 탐색 작업을 전용 하드웨어로 이전해, 바운딩 볼륨 탐색 과정의 병목을 해소했다. 이로써 실시간 글로벌 일루미네이션이나 반사 효과 등 고부하 그래픽 처리에서도 안정적인 성능을 확보했다.
데머스 수석 부사장은 “새로운 RTU 구조는 단순한 수적 확장이 아니라, 트리 탐색·교차 연산을 완전 병렬화한 아키텍처 전환”이라며 “통합형 GPU 환경에서의 레이트레이싱 효율을 크게 높였다”고 말했다.
아드레노 X2는 GPU 내부에 고성능 전용 메모리 HPM(High Performance Memory)을 새롭게 탑재했다. 총 용량은 21MB다. 슬라이스당 5.25MB씩 배정된다. 이 메모리는 기존처럼 렌더링 데이터를 DRAM으로 전송하지 않고, GPU 내부에서 바로 저장·가공할 수 있게 한다. 퀄컴은 이를 통해 렌더링 중간 단계에서 최대 40%의 외부 대역폭을 절감했다고 밝혔다.
그는 “GPU 내부에서 렌더링과 포스트 프로세싱을 모두 수행한 뒤, 완성된 이미지만 DRAM에 압축 저장하는 구조”라며 “지연 시간과 전력 소모를 모두 줄이면서 대규모 그래픽 연산에 유리한 구조”라고 설명했다.
이는 모바일 시절의 타일 기반 렌더링(Tiled Rendering)을 발전시킨 개념이라고 볼 수 있다. PC용 통합 GPU에서도 실질적인 성능 향상을 이끌어낼 것으로 기대된다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
아드레노 X2는 최신 그래픽 API를 모두 지원한다. 다이렉트X 12.2 울티메이트의 모든 기능을 구현했고, 벌칸(Vulkan) 1.4, OpenCL 3.0, SYCL(시클) 지원도 순차 적용된다.
메쉬 셰이딩(Mesh Shading), 가변 셰이딩(VRS), 샘플러 피드백(Sampler Feedback), XR 1.1 등도 지원한다. 마이크로소프트와 협업해 윈도우 온 ARM 환경에서의 호환성 문제를 개선했다.
퀄컴은 드라이버 업데이트 주기를 기존 분기별에서 월 단위로 단축할 계획이다. ‘스냅드래곤 컨트롤 패널’이 X1과 X2 모두에서 활성화돼, 사용자는 실시간으로 GPU 드라이버 업데이트를 확인하고 설치할 수 있다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
데머스 수석 부사장은 “개별 타이틀 최적화 작업은 거의 없었고, 대부분은 기본 상태에서의 결과”라며 “실제 OEM이 생산할 상용 제품에서는 더 높은 성능 여지를 남겨두고 있다”고 말했다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
배터리 이벤트 발생 시에는 GPU 클록을 자동으로 낮추고, 작업이 완료되면 전체 GPU 전원을 차단해 대기 전력을 최소화한다. GMU는 또한 시스템 수준에서 CPU와 전력 정보를 교환하며, 플랫폼 전체의 전력 균형을 조율한다. 이러한 구조는 ‘올웨이즈 커넥티드 PC(Always Connected PC)’라는 퀄컴의 장기 전략에 맞춰, 장시간 배터리 수명과 즉시 대기 복귀를 동시에 달성하기 위한 설계다.
<이미지를 클릭하시면 크게 보실 수 있습니다> |
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
