<이미지를 클릭하시면 크게 보실 수 있습니다> |
지난해 저비용·고효율 인공지능(AI) 모델로 글로벌 AI 업계를 놀라게 했던 중국 스타트업 딥시크가 차세대 AI 모델을 공개합니다.
3일 파이낸셜타임스와 로이터통신 등에 따르면 딥시크는 4일 차세대 거대언어모델(LLM) 'V4'를 선보일 예정입니다.
V4는 최대 1조 개 규모의 매개변수(파라미터)를 갖춘 대형 모델로, 추론에 특화된 R1과 달리 범용 모델에 해당합니다. 텍스트뿐 아니라 이미지와 영상 등 다양한 데이터를 처리할 수 있으며 특히 코딩 분야에서 강점을 보일 것으로 전해집니다.
딥시크는 모델 개발 과정에서 엔비디아와 AMD 등 미국 반도체 기업에 사전 접근권을 제공하지 않았습니다. AI 기업들은 모델 출시 전 주요 칩 제조사와 협력해 성능 최적화 작업을 진행합니다. 신규 모델이 해당 칩에서 안정적으로 구동되는지 테스트하기 위해서입니다.
그러나 딥시크는 미국 기업 대신 화웨이와 캄브리콘 등 중국 업체와 협력해 사전 최적화를 진행한 것으로 알려졌습니다. AI 칩 시장을 주도하는 엔비디아와의 협력을 배제한 것은 이례적인 행보로 평가됩니다.
V4 공개 시점도 상징적입니다. 공개일인 4일은 중국 최대 정치 행사인 양회(전국인민대표대회·중국인민정치협상회의)가 개막하는 날입니다. 딥시크가 중국 기술 굴기의 상징적인 기업임을 부각하려는 의도로 풀이됩니다.
딥시크는 지난해 1월 추론 모델 R1을 공개하며 글로벌 AI 시장에 충격을 안긴 바 있습니다. 미국의 대중 제재 속에서도 챗GPT 등 미국 AI 모델과 견줄 만한 성능을 보여 '딥시크 쇼크'라는 평가를 받았습니다. 이 사건을 계기로 AI 산업의 과도한 투자에 대한 'AI 거품론'이 제기되기도 했습니다.
다만 이번 V4가 완전히 중국 기술만으로 개발됐는지는 논란의 여지가 있습니다. 지난달에는 V4 훈련 과정에서 엔비디아의 최신 AI 칩 '블랙웰'이 사용됐다는 미 행정부 고위 관계자의 주장도 제기됐습니다. 앤트로픽 또한 딥시크를 포함한 중국 AI 기업들이 자사 AI 모델 '클로드'의 기능을 불법적으로 추출해 활용했을 가능성이 있다고 주장하기도 했습니다.
딥시크가 양회 개막과 함께 차세대 AI 모델을 공개하며 기술 자립 의지를 강조한 가운데, 이번 V4가 또 한 번 글로벌 AI 시장에 딥시크 쇼크를 안길 수 있을지 궁금합니다.
자료=미디어뱀부
정리=김현기 기자 khk@techm.kr
<저작권자 Copyright ⓒ 테크M 무단전재 및 재배포 금지>
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
