컨텐츠 바로가기

04.20 (토)

'초거대 AI 시대'..."지스트 HPC 공용인프라, 韓 AI 연구자들 꿈에 날개 달아줄 것"

댓글 첫 댓글을 작성해보세요
주소복사가 완료되었습니다
AI타임스

광주과학기술원(GIST)의 김종원 AI대학원장 겸 슈퍼컴퓨팅센터장은 AI타임스와의 인터뷰에서 HPC-AI 공용인프라 구축사업의 목표와 계획 등에 관해 이야기를 풀어갔다. (사진=유형동 기자).

<이미지를 클릭하시면 크게 보실 수 있습니다>


광주과학기술원(GIST)의 김종원 AI대학원장 겸 슈퍼컴퓨팅센터장은 AI타임스와의 인터뷰에서 HPC-AI 공용인프라 구축사업의 목표와 계획 등에 관해 이야기를 풀어갔다. (사진=유형동 기자).AI 컴퓨팅 인프라 공동 활용 체제에서 리더십 발휘할 것

"HPC-AI 공용인프라 구축사업을 통해 거대 인공지능(AI) 연구‧활용 활성화를 이끌어 AI 분야 경쟁력을 제고함은 물론, 국가적으로 광주가 리더십을 갖고 파일럿 기능을 수행하는 데 있어 GIST도 나름의 역할을 갖고 기여하겠다."

광주과학기술원(GIST‧지스트)의 김종원 GIST AI대학원장 겸 슈퍼컴퓨팅센터장은 이 같이 강조한다. 최근 GIST는 과학기술정보통신부‧정보통신산업진흥원‧인공지능산업융합사업단이 주관하는 고성능 컴퓨팅 기반 인공지능(HPC-AI) 공용인프라 구축사업의 주관기관으로 선정됐다.

전 세계적으로 거대 규모의 HPC 기반 AI 컴퓨팅 인프라 구축 경쟁이 뜨겁다. 이에 AI중심도시 광주에서도 AI 융합연구‧교육‧기업 지원을 위한 HPC/AI/HPDA 공용인프라 구축사업이 본격화됨에 따라, GIST 내 파일럿 슈퍼컴퓨팅센터 운영에 대한 기대감은 더욱 높아지고 있다.

※ HPC/AI/HPDA 인프라 : 고성능 컴퓨팅과 빅데이터 분석을 하나로 통합‧융합하는 방식으로 운용되는 다목적 AI 컴퓨팅 인프라

이번 사업은 HPC-AI 공용인프라를 성공적으로 구축함으로써 산‧학‧연‧관 AI 생태계 활성화에 기여하는 것을 목표로 한다. 특히 사업 주관기관인 GIST를 중심으로 광주 첨단3지구의 AI 집적단지 인프라에 뜨거운 관심을 보이는 국내외 산학연관을 위한 마중물 역할을 할 전망이다.

AI타임스

광주과학기술원(지스트‧GIST) 전경. (사진=지스트 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>


광주과학기술원(지스트‧GIST) 전경. (사진=지스트 제공).Q. 최근 GIST가 HPC-AI 공용인프라 구축사업 수행기관으로 선정됐다.지난 8월에 인공지능산업융합사업단이 AI 중심 산업융합 집적단지 조성사업의 일환으로 국내 최대 규모 HPC-AI 공용인프라 구축사업을 공고했다. 이에 GIST가 제안‧심사 과정을 거쳐 주관기관으로 최종 확정돼, 현재 사업을 진행하고 있다. 사업기간은 올해부터 오는 2023년까지, 성과관리기간은 2024년부터 2027년까지다.

우리가 내세운 캐치프레이즈는 'Go, HIGH!'다. H(Hyper-Scale), I(Init), G(Glocalization), H(Hub)의 의미를 담고 있다. 이에 따라 ▲AI 최적화 공용인프라 구축 ▲파일럿 방법론에 따른 AI+X 테스트베드 선도 ▲광주를 넘어 세계로 지향하는 산학연관 협업 ▲도메인별 데이터 기반 대규모 AI 지역거점 허브 제공 등의 전략을 세웠다. 이를 통해 HPC-AI 기반 공용인프라를 구축함으로써 산학연관 AI 생태계에 기여하는 것이 바로 이번 사업의 목표라고 할 수 있다.

AI타임스

(사진=GIST 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>


고성능 컴퓨팅 기반 인공지능(HPC-AI) 공용인프라 구축사업의 개요 및 목표. (사진=GIST 제공).
AI타임스

김종원 GIST AI대학원장이 HPC-AI 공용인프라 구축사업의 목표와 전략을 소개하고 있다. (사진=유형동 기자).

<이미지를 클릭하시면 크게 보실 수 있습니다>


김종원 GIST AI대학원장이 HPC-AI 공용인프라 구축사업의 목표와 전략을 소개하고 있다. (사진=유형동 기자).◆ '6PF‧10PB' HPC-AI 공용인프라, 어느 정도 규모일까

현재 GIST는 내년 초 개소를 목표로 캠퍼스 내 AI대학원 공간에 100랙(Rack) 규모의 'G-I-S-T 데이터센터' 시설의 실무 작업을 진행하고 있다. 200Gbps(기가비피에스)의 초고속 패브릭으로 밀결합돼 연동되는 6PFlops(페타플롭스, 32bit 기준) 계산용량의 GPU 노드와 총 10PByte(페타바이트) 저장용량의 스토리지 노드를 지원한다는 구상이다.

※ Gbps(기가비피에스) : 1Gbps는 1초당 1기가비트를 전송할 수 있는 속도

※ PFlops(페타플롭스) : 1초당 1,000조번 연산처리가 가능한 컴퓨터 성능 단위

※ PByte(페타바이트) : 1PB는 약 100만 GB로 DVD영화(약 6GB) 17만 4,000편을 담을 수 있는 용량

AI타임스

내년 초 개소 예정인 GIST AI대학원 내 'G-I-S-T 데이터센터' 조감도. 'Green-Intelligent-Sustained-Technical' 개념을 지향하는 스마트 그린 데이터센터다. (사진=GIST 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>


내년 초 개소 예정인 GIST AI대학원 내 'G-I-S-T 데이터센터' 조감도. 'Green-Intelligent-Sustained-Technical' 개념을 지향하는 스마트 그린 데이터센터다. (사진=GIST 제공).오는 2023년까지 광주 첨단3지구에 들어서는 국가AI데이터센터의 경우 컴퓨팅 연산능력이 88.5PF, 저장용량은 107PB로 알려져 있다. 88.5PF는 1초에 8경8,500조번 부동(浮動) 소수점 연산을 할 수 있다는 의미이며, 107PB는 1GB 영화 약 1억편의 양과 맞먹는 용량이다. 김종원 AI대학원장은 "이를 기준으로 계산했을 때 '6PF, 10PB' 수준을 말한다"고 밝혔다.

앞서 GIST는 AI-X 컴퓨팅 클러스터 운영을 위해 국내 대학 최초로 엔비디아(NVIDIA)의 최신 DGX-A100 GPU 시스템을 도입했다. DGX-A100은 전 세계적으로 AI 연구에 널리 쓰이고 있는 만큼 대세라고 볼 수 있다. 네이버도 최근 공개한 '하이퍼클로바(HyperCLOVA)'를 위해 엔비디아가 개발한 슈퍼컴퓨터인 '슈퍼팟(SuperPOD)'을 도입했다. 바로 여기에 700억 원 정도의 예산이 투입된 DGX-A100 140대가 들어갔다.

김 원장은 "우리는 약 100억 원의 예산을 들여 40대 정도의 규모로 진행하고 있다"고 말했다. 이어 "다만 네이버는 하이퍼클로바를 일반에 공개하고 있지 않지만, 우리의 경우 공용인프라라는 특성상 공개가 된다"고 덧붙였다. 지역에 있는 AI융합대학들이 교육‧연구에 필요한 계산을 할 수 있도록 지원하라는 꼬리표가 HPC 공용인프라에는 붙어 있다는 것. 대학들뿐만이 아니라 기업에서도 이를 사용할 수 있도록 제공한다. 교육‧연구 지원과 기업 지원, 이 두 가지가 이번 사업의 핵심 역할이라는 설명이다.

AI타임스

GIST AI대학원 AI-X 컴퓨팅 클러스터. (사진=GIST 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>


GIST AI대학원 AI-X 컴퓨팅 클러스터. (사진=GIST 제공).Q. 이번 HPC-AI 공용인프라의 특징을 말하자면.G-I-S-T 데이터센터의 HPC-AI 공용인프라는 광주 AI집적단지의 국가AI데이터센터의 본격 운영에 앞선 선발대 즉 파일럿 개념으로 보면 될 것 같다. HPC-AI 인프라는 '하나로 묶어 쓸 수 있는 장비'라고 말할 수 있다. 각기 따로 쓰는 일반 인프라와 달리 HPC 인프라는 이를 하나처럼 쓸 수 있는 구조다.

거대 규모의 AI에 쓰이는 장비는 대부분 이러한 속성을 필요로 한다. 몇 대 있는지가 중요한 게 아니라 몇 대를 함께 사용할 수 있는지가 중요하다. 이 같은 측면에서 향후 구축될 HPC-AI 공용인프라의 경우 국내에서는 유일하다고 말씀드릴 수 있겠다. 물론 전 세계적으로 이 정도 규모를 가진 사업자들이 있기는 하나, 자유롭게 공용으로 사용할 수 있지 않은 데다 비용도 많이 든다.

특히 요즘 '거대 AI' 바람이 불고 있다. 초창기만 해도 '스케일'이나 '초거대'라는 말이 없었는데, 지난해부터는 '하이퍼스케일(Hyperscale)'을 많이 이야기한다. 전체적인 AI 연구의 방향이 하이퍼스케일로 나아가는 상황에서 규모 있는 인프라는 필수적이다. 그런데 '하이퍼스케일 AI' 인프라는 비용적인 문제에서 자유롭지 못하다. 굉장히 돈이 많이 들고 집약적이기 때문이다.

이번 사업에 따라 무료 서비스는 아니지만 굉장히 저렴한 유료 서비스가 제공될 계획이다. 사업 예산의 경우 국가에서 100% 지원을 받는 것은 아니다. 인공지능산업융합사업단의 지원과 더불어 GIST 자체 투자로 이뤄지게 된다. 에너지 절감형으로 설계된다고 해도 실제 운영 시 전기료 등의 전체 비용을 고려하면 예산의 두 배 정도가 투입될 것으로 추산하고 있다.

또한 AI 분야에서 핵심적인 부분 가운데 하나가 바로 데이터 이동이다. 우리는 10PB의 저장용량에 1PB 플래시 스토리지를 도입한다. 올 플래시(All flash) 1PB면 생각보다 굉장히 초고성능 스토리지다. 하이퍼스케일 AI가 주목받기 전까지는 데이터의 이동에 크게 신경을 안 썼다. 하지만 이는 HPC에서 매우 중요한 부분이다. 잘 밀결합시켜서 데이터가 바로 GPU에 투입되도록 만드는 체제가 필요한데, 우리 시스템은 이를 지원할 수 있도록 설계됐다.

AI타임스

김종원 GIST AI대학원장이 향후 구축될 HPC-AI 공용인프라에 대해 설명하고 있다. (사진=유형동 기자).

<이미지를 클릭하시면 크게 보실 수 있습니다>


김종원 GIST AI대학원장이 향후 구축될 HPC-AI 공용인프라에 대해 설명하고 있다. (사진=유형동 기자).◆ "국가AI데이터센터 기다리는 산학연관 가려운 곳 긁어 드립니다"

향후 구축될 HPC-AI 공용인프라는 AI융합대학 협력을 통한 연구‧교육용 AI 컴퓨팅을 지원하고, 거대 규모 학습이 필요한 국내 산학연 및 글로벌 파트너들을 위한 맞춤형 HPC-AI 컴퓨팅 서비스를 제공하는 데 활용된다. 2023년까지는 HPC-AI 공용인프라 장비의 구축과 운영을 단계별로 완료하고, 자동화된 통합관리를 바탕으로 99.9%의 가동률 달성을 목표로 하고 있다.

GIST는 수익 모델 창출을 통한 운영 자립화를 위해 오는 2027년까지 국가 초고성능 컴퓨팅 지역 거점형 전문센터 유치를 통한 HPC-AI 인프라 용량 확대와 수요 맞춤형 서비스 고도화, 글로벌 파트너 유치 등을 추진할 계획이다.

김종원 원장은 "국내 산학연관 기업들을 위한 맞춤형 서비스 창출로 선순환하는 AI 생태계 태동에 이바지하기 위해 최선을 다하겠다"며 "GIST 슈퍼컴퓨팅센터가 국가 사이언스 네트워크의 성장을 위한 기초연구 및 산업기술 개발에 힘을 보탤 수 있을 것으로 기대한다"고 강조했다.

특히 GIST는 올해 인공지능산업융합사업단이 공고한 AI융합대학 사업에 이어 공용인프라 구축사업에도 선정됨에 따라, AI 중심 산업융합 집적단지 조성사업에 실질적으로 기여함으로써 AI에 기반을 둔 지역 혁신과 일자리 창출 및 고급 AI 인재 양성을 위해 더욱 힘쓰겠다는 포부다.

AI타임스

<이미지를 클릭하시면 크게 보실 수 있습니다>


국가AI데이터센터는 오는 2023년 완공을 목표로 광주 첨단3지구에 연면적 3,144㎡ 규모로 건립된다. 사진은 AI집적단지 조감도. (사진=광주광역시 제공). 현재 광주 AI집적단지의 국가AI데이터센터는 오는 2023년 완공을 목표로 하고 있다. 국가AI데이터센터 준공 전까지 고가의 AI 가속기를 당장 필요로 하는 기업들을 위해 올해에는 최종 구축 목표의 10% 수준인 8.85PF와 10.7PB가 NHN의 클라우드센터를 통해 우선적으로 지원된다. 인공지능산업융합사업단에서 지원하는 컴퓨팅 자원은 연차적으로 확대돼 2023~2024년에는 88.5PF 연산성능과 107PB 저장공간을 제공할 수 있게 될 예정이다.

이 가운데 국가AI데이터센터는 전체 용량의 약 20%에 해당하는 20PF를 HPC용으로 구축한다. 전체 용량 중에 20PF만 HPC용으로 운영해 대규모 계산을 한꺼번에 할 수 있도록 지원하고, 이 외 나머지는 클라우드형 서비스로 여러 기관에서 동시에 쓸 수 있도록 할당하게 된다.

이 같은 측면에서 볼 때 G-I-S-T 데이터센터는 국가 AI데이터센터가 완공되는 2023년까지 AI 교육·연구기관과 기업의 컴퓨팅 자원을 지원하는 데 있어 고유한 리더십을 발휘할 것으로 보인다. 향후 국가AI데이터센터가 구축되더라도 이와 함께 시너지를 내면서 하이퍼스케일 AI를 위한 핵심 축의 역할을 계속 이어갈 전망이다.

AI타임스

국가 AI데이터센터가 들어서는 첨단 3지구 토지이용계획. (사진=광주광역시 제공).

<이미지를 클릭하시면 크게 보실 수 있습니다>


국가 AI데이터센터가 들어서는 첨단 3지구 토지이용계획. (사진=광주광역시 제공).Q. HPC-AI 공용인프라의 역할론에 대해.국가AI데이터센터가 계획대로 완공될 시 아마 오는 2023년에는 서비스가 가능할 것이다. 앞서 AI데이터센터에서 지원하고 있는 컴퓨팅 자원은 기업을 위해 개별 GPU를 일부 제공하는 서비스에 해당한다. 또 현재 추진 중인 유사한 다른 인프라 사업들을 고려할 때 2023년 후반이나 2024년 초반이 되어야 국가적인 공용인프라가 늘어날 것으로 전망된다.

그전까지는 우리가 1년 정도 유니크한 포지셔닝을 할 것으로 기대하고 있다. 게다가 현재로서는 국내에서 이 정도 규모로 HPC 인프라를 쓸 수 있도록 지원하는 서비스는 없다고 본다. 그렇기 때문에 이번 사업에 따라 내년 6월이면 1차적으로 대부분 구축이 완성되는데, 1년 이상 나름 독점적인 지위를 누릴 것으로 예상하고 있다. 물론 국가적 차원에서 그 기간은 짧을수록 좋을 것이다. 지금 진행 중인 공용인프라 규모만으로는 아직도 많이 부족하다.


기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.