1조 토큰 훈련에 약 13억원 비용”
중국 상하이에서 지난해 7월 4일 열린 세계 인공지능(AI) 콘퍼런스에서 한 참관객이 앤트그룹 부스를 둘러보고 있다. 상하이/AP뉴시스 |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
알리바바그룹 자회사이자 세계 최대 핀테크 업체인 앤트그룹이 ‘저비용 고효율’ 인공지능(AI) 돌풍을 일으킨 중국 딥시크와 비슷한 결과를 냈다고 주장했다.
24일 블룸버그통신에 따르면 앤트그룹은 중국산 반도체를 사용해 AI 모델 훈련 비용을 20% 절감하는 기술을 개발했다고 밝혔다.
한 소식통은 “앤트가 알리바바의 다른 자회사와 화웨이테크놀로지가 개발한 중국산 칩을 사용해 머신러닝 중 ‘전문가 혼합(MoE)’ 접근 방식을 통해 AI 모델을 훈련시켰다”며 “이 방식은 엔비디아의 ‘H800’ 칩과 유사한 결과를 얻었다”고 설명했다. 앤트는 여전히 엔비디아 칩을 사용하고 있지만, 최신 모델에서는 AMD와 중국산 칩을 주로 사용하고 있다고 블룸버그는 덧붙였다.
앤트는 이달 발표한 연구 논문에서 특정 벤치마크에는 메타의 AI 모델을 능가하는 성과를 기록했다고 주장했다. 다만 이 주장은 아직 독립적으로 검증되지 않았다. 만약 이 주장이 사실이라면, 앤트 플랫폼은 AI 서비스의 추론 비용을 절감하는 데 중요한 역할을 할 수 있다고 블룸버그는 평가했다.
앤트는 “고성능 하드웨어를 사용해 1조 토큰을 훈련하는 데 약 635만 위안(약 13억 원)이 들어간다”며 “최적화된 접근 방식을 통해 저사양 하드웨어를 사용해 비용을 510만 위안으로 줄일 수 있다”고 주장했다. 토큰은 AI 모델이 세계에 대해 학습하고 사용자 질의에 유용한 응답을 제공하기 위해 처리하는 정보 단위다.
앤트는 최근 개발한 거대언어모델(LLM)인 ‘링 플러스’와 ‘링 라이트’를 활용해 의료와 금융 산업용 AI 솔루션을 제공할 계획이다.
[이투데이/배준호 기자 (baejh94@etoday.co.kr)]
이투데이(www.etoday.co.kr), 무단전재 및 수집, 재배포금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.