컨텐츠 바로가기

    12.08 (월)

    [김정호의 AI시대 전략] HBM 다음은 HBF… 메모리 중심 ‘인공지능 컴퓨팅 시대’가 다가온다

    댓글 첫 댓글을 작성해보세요
    주소복사가 완료되었습니다

    에리히 프롬이 ‘사랑의 기술’에 쓴 집중도·연결망, AI에도 적용돼

    HBM으론 부족… 新메모리 수십만대 묶어 ‘인공지능 팩토리’로

    인간은 서로 교류하며 살아가는 사회적 동물이다. 관계를 맺는 사람들은 가족, 친구, 직장 동료, 학교 동창, 지역 주민들이다. 사회적 관계의 빈도·중요도를 다이어그램으로 표시하기도 한다. 시각적으로 한눈에 중요도를 표현할 수 있어서다. 만나는 횟수에 비례해 연결선 굵기를 바꿀 수 있다. 자주 만나는 사람을 가까이 배치할 수도 있다. 맺는 관계를 종류별로 나누어 색깔로 표시할 수도 있다. 지하철 노선도 같은 형태가 된다. 이를 연결망이라 부른다. 우리는 이런 관계를 시각적 방법으로 표현하고 그에 따라 만나는 횟수와 시간, 순서를 정할 수 있다. 또 이런 관계도는 영화·소설에서 스토리를 심층 분석하는 데 도움이 된다. 이야기 밑의 논리와 동기, 포괄적 캐릭터 생태계를 구축할 수 있다.

    독일계 미국인으로 사회심리학자이자 정신분석학자, 철학자인 에리히 프롬은 책 ‘사랑의 기술’에서 인간 관계의 질적 향상을 위한 네 가지 실천을 제시했다. 바로 ‘관계 집중도’ ‘관심’ ‘존중’ ‘책임’이다. 그중 으뜸이 집중도다. 이는 인공지능에도 적용된다.

    조선일보

    올해 1월 미국 라스베이거스에서 열린 세계 최대 IT 전시회 ‘CES 2025’에서 SK하이닉스가 공개한 고대역폭 메모리 HBM3E 모형. /SK하이닉스

    <이미지를 클릭하시면 크게 보실 수 있습니다>


    생성형 인공지능도 단어와 단어, 그림과 그림의 관계도를 학습하고 확률적으로 최선의 답을 순서대로 쏟아낸다. 이런 관계도를 전문 용어로 ‘집중도(Attention)’라 부른다. 생성형 인공지능의 핵심 알고리즘이다. 인간에게 사랑의 기술이 그런 것처럼 인공지능에서도 집중도가 중요하다. 학습 과정에서 그 관계도를 배우고 추론 과정에서 이를 실천한다. 학습된 집중도를 참고 삼아 다음 단어들을 생성한다. 집중도는 수학 행렬로 표시한다. 이 행렬을 전문 용어로 ‘열쇠가치값’이라 부른다. 이 집중도를 학습하려면 고성능 GPU가 필요하다. 특히 이 집중도를 기억하는 장치가 고용량·고대역폭 HBM이다. 이제 HBM의 용량이 부족해져 간다. 기억해야 할 집중도 크기가 지속적으로 증가해서다. 문서를 넘어 동영상까지 생성하려면 증가할 수밖에 없다.

    HBM보다 10배 정도 용량이 큰 반도체로 개발 중인 제품이 바로 ‘HBF(High Bandwidth Flash Memory)’, 고대역폭 낸드플래시 메모리이다. HBM은 휘발성 메모리인 디램(DRAM)을 쌓아 용량·속도를 동시에 추구하는 휘발성 메모리다. 현재 생성형 인공지능에서 가장 필수다. 최근 엔비디아 젠슨 황이 약속한 GPU 26만대 옆에는 HBM 208만대가 설치된다. 그 용량 부족 문제를 해결하는 차세대 인공지능 메모리가 HBF다. 낸드플래시 메모리를 쌓은 고용량 메모리이다. 낸드플래시 메모리는 전원이 꺼져도 지워지지 않는 비휘발성 메모리이다. HBM은 주로 행렬을 빠르게 쓰고 읽기 적합하고, HBF는 대용량 집중도를 자주 읽기 적합하다. 인공지능이 더 발전해 인간 수준의 일반인공지능(AGI)으로 성장하려면 반드시 필요한 메모리가 HBF다. 다가올 인공지능 패권 시대에 기술과 시장의 입장에서 HBM 못지않게 점점 더 중요해질 전망이다.

    일반 인공지능을 구현하려면 꼭 필요한 인공지능 구조가 복합 전문(MoE·Mixture of Experts) 인공지능이다. 법률·의료·교육·광고·유통·생산 등 전문 분야별 인공지능을 개발해 이들이 연합해서 결과를 생성한다. 이렇게 되면 전문 분야별 변수와 각각의 집중도를 학습하고 기록해야 한다. 고대역 초거대 용량 HBF가 필요한 이유다. 그리고 인공지능이 보고서를 작성할 때 최근 참고 자료를 보면서 작성한다. 이 방법을 ‘탐색 증강 생성(RAG)’이라 부른다. 시험을 보는데 참고 자료를 보면서 오픈북 시험을 보는 것과 같다. 인터넷에서 최신 자료를 보면서 자료를 생성한다. 이렇게 하면 가짜 뉴스와 인공지능이 사실과 전혀 다르게 답변하는 ‘AI 할루시네이션’ 현상을 줄일 수 있다. 참고 자료 출처를 함께 표시할 수도 있는 것이다. 이러한 탐색 증강 생성에서는 많은 자료를 GPU 바로 옆에 보관하고 언제든지 볼 수 있는 대용량 메모리가 필요하다. 이런 용도로도 HBF가 필요하다. HBF는 책상 바로 옆의 책꽂이 혹은 도서관에 비유될 수 있다.

    한편 로봇과 인공지능이 결합하는 물리인공지능(Physical AI)에서도 많은 주변 자료를 저장해 두어야 한다. 그래야 로봇이 실시간으로 상황을 파악하고 결정하며 행동을 수행할 수 있다. 이때 공간과 시간 영역에서 수집한 ‘집중도(Attention)’를 저장해야 한다. 그리고 물리인공지능이 학습하기 위한 가상 공간과 물리 실험 장소가 있어야 한다. 여기서 엄청난 분량의 데이터가 생산된다. 이 데이터들을 저장하고 실시간으로 꺼내보는 목적으로 HBF가 필요해진다. 이렇게 미래 인공지능 데이터 센터에는 수만 대의 GPU, 수십만 대의 HBM과 HBF가 집적되고 연결되어 협력할 것이다. 이러한 시설을 다른 말로 ‘AI 팩토리’라 부른다.

    엔비디아 CEO 젠슨 황과 이재용 삼성전자 회장, 그리고 정의선 현대차그룹 회장이 함께 서울 삼성역 인근 깐부치킨 매장에서 깜짝 ‘치맥 회동’을 했다. HBM 없이 GPU가 존재하기 어렵기 때문이다. 협상과 협력에는 이처럼 주고받을 무기가 있어야 한다. 여기에 HBF가 힘을 보탤 전망이다. 앞으로 젠슨 황이 더 자주 우리나라를 방문할 것으로 기대한다. 인공지능 세상에는 컴퓨팅 중심에 메모리가 있다. 이를 ‘메모리 중심 컴퓨팅’이라 부른다.

    매일 조선일보에 실린 칼럼 5개가 담긴 뉴스레터를 받아보세요. 세상에 대한 통찰을 얻을 수 있습니다.

    '5분 칼럼' 더보기

    [김정호 KAIST 전기·전자공학과 교수]

    - Copyrights ⓒ 조선일보 & chosun.com, 무단 전재 및 재배포 금지 -
    기사가 속한 카테고리는 언론사가 분류합니다.
    언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.