2024년, 생성형 AI 파일럿 프로젝트가 급증하면서 높은 실험 비용과 불확실한 이점에 대한 우려가 촉발되었다. 기업 역시 비즈니스 성과, 데이터 품질 향상, 인재 개발로 초점을 전환하게 되었다.
2025년에는 기업이 전략에 우선순위를 두고, 생성형 AI 프로젝트를 지원하기 위해 경영과 IT간의 파트너십을 확대하고, 대형 언어 모델(LLM) 파일럿 프로젝트를 프로덕션 인스턴스로 전환할 것으로 예상된다. 또한 데이터센터의 처리 성능에 과부하를 주지 않으면서 특정 작업을 처리하는 소규모 언어 모델도 등장할 것이다.
포레스터 리서치에 따르면 기업은 또한 데이터와 AI를 더 잘 관리하기 위해 새로운 기술과 아키텍처를 채택할 것이며, 예측 AI로 복귀할 것이다.
포레스터 애널리스트 자예시 차우라시아가 예측 AI는 과거 데이터와 머신러닝, 통계 등의 기술을 사용해 미래의 사건이나 행동을 예측한다고 말했다. 반면, 생성형 AI는 생성적 적대 신경망(GAN) 같은 딥러닝 방법을 활용해 이미지, 텍스트, 동영상, 합성 데이터와 같은 새로운 콘텐츠를 생성한다. 차우라시아는 사용례의 50% 이상이 예측 AI로 돌아설 것으로 예측한다.
물론 LLM은 기업이 복잡한 작업을 처리하고 운영을 개선하는 데 도움을 주는 생성형 AI의 핵심이다. 포레스터에 따르면 전략을 가진 미국 생성형 AI 의사 결정권자의 55%가 애플리케이션에 내장된 LLM을 사용하고, 33%는 도메인별 생성형 AI 앱을 구매한다고 한다.
한편, SLM도 빠르게 주목을 받고 있다. 가트너 리서치의 수석 부사장이자 애널리스트 아룬 찬드라세카란은 “대다수 기업은 여전히 생성형 AI 투자에서 비즈니스 가치를 실현하는 데 어려움을 겪고 있다”라고 지적하며 중소규모 언어 모델의 부상으로 고객이 정확성, 속도, 비용의 상충 관계를 더 잘 충족할 수 있을 것이라고 말했다.
Gartner |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
포레스터 보고서에 따르면 내년에는 SLM 통합이 60%까지 급증할 것으로 예상된다.
IT 의사 결정권자 10명 중 약 8명이 작년에 소프트웨어 비용이 증가했다고 보고함에 따라, 비용 효율성이 높고 특정 도메인에 대한 교육을 통해 정확성, 관련성, 신뢰성을 향상할 수 있는 SLM을 찾고 있다. 또한 금융, 의료, 법률 서비스 등의 전문 산업에서도 통합이 용이하고 엑셀을 활용하기가 더 쉽다.
2025년까지 7억 5,000만 개의 앱이 LLM을 사용할 것으로 예상되며, 생성형 AI 시장의 빠른 성장을 뒷받침한다. 포레스터는 이 시장의 가치가 2023년 15억 9,000만 달러에서 2030년 2,598억 달러로 성장할 것으로 예측하고 있다.
이러한 성장에도 불구하고 많은 AI 전문가는 성능과 환경 영향 측면에서 워크플로우와 반복적인 작업을 자동화하는 데 LLM이 과도할 수 있다고 주장한다. 코넬대학교의 연구에 따르면 오픈AI의 GPT-3 LLM을 훈련하는 데 110만 파운드에 해당하는 500미터톤의 탄소가 소비되는 것으로 나타났다.
기업이 기대치를 충족하는 데 어려움을 겪으면서 2025년 생성형 AI 투자는 유지보수, 개인화, 공급망 최적화, 수요 예측과 같은 검증된 예측 AI 애플리케이션으로 전환될 가능성이 높다. 또한 미래 지향적인 기업은 예측과 생성형 AI의 시너지를 인식해 예측을 통해 생성형 결과물을 향상할 것이다. 포레스터에 따르면 이러한 접근 방식은 결합된 사용례의 비중을 현재의 28%에서 35%로 끌어올릴 것으로 예상된다.
소규모 언어 모델이란 무엇인가?
간단히 말해 SLM은 경량 생성형 AI 모델이다. 경영 컨설팅 및 소프트웨어 개발 회사인 버전원(Version 1)의 AI 연구실 수석 기술 연구원 로즈마리 토마스에 따르면 ‘작다’는 것은 모델의 신경망 크기, 매개변수 수, 학습되는 데이터의 양을 의미한다.
SLM은 사용하는 컴퓨팅 리소스가 적으므로 온프레미스 또는 프라이빗 클라우드 배포가 가능하고기본적으로 개인 정보 보호 및 보안이 강화된다.
토마스는 일부 SLM 구현에는 상당한 컴퓨팅 및 메모리 리소스가 필요하만, 몇몇 모델은 50억 개 이상의 매개 변수를 가지고 단일 GPU에서 실행될 수 있다고 말했다.
가트너 리서치는 SLM을 100억 개 이하의 파라미터를 가진 언어 모델로 다르게 정의한다. LLM에 비해 2~3배(약 100~1,000배) 더 작기 때문에 사용 또는 사용자 지정에 훨씬 더 비용 효율적이다.
구글의 제미나이 나노, 마이크로소프트의 오카(Orca)-2-7b 및 오카-2-13b, 메타의 라마-2-13b 등이 SLM에 포함된다. 토마스는 최근 게시물에서 더 효율적인 모델과 학습 속도, 설정 속도에 대한 수요가 SLM 성장을 주도하고 있다고 주장하며, SLM의 성장에 대해 언급했다.
Gartner |
<이미지를 클릭하시면 크게 보실 수 있습니다> |
토마스는 “SLM은 컴퓨팅 리소스, 교육 시간, 특정 애플리케이션 요구 사항과 같은 실질적인 고려 사항으로 인기를 얻고 있다”라며 지난 몇 년 동안 SLM은 특히 지속 가능성과 효율성이 크루셜한 시나리오에서 점점 더 관련성이 높아졌다고 말했다.
가트너에 따르면 SLM을 통해 대다수 기업은 업무 전문화를 달성하고 생성형 AI 솔루션의 정확성, 견고성, 신뢰성을 개선할 수 있다. 또한 가트너는 구축 비용, 데이터 프라이버시, 위험 완화는 생성형 AI를 사용할 때 주요 과제이므로 SLM은 대부분의 기업에 LLM에 대한 비용 효율적이고 에너지 효율적인 대안을 제공한다고 밝혔다.
스타트업 하이퍼스사이언스가 의뢰해 500명 이상의 사용자를 대상으로 실시한 해리스 여론조사에 따르면 IT 의사 결정권자 4명 중 3명(75%)이 속도, 비용, 정확성, ROI 측면에서 SLM이 LLM보다 우수하다고 생각하는 것으로 나타났다.
라고 AI 기반 사무 자동화 도구를 개발하는 하이퍼사이언스의 CEO 앤드류 조너는 “데이터는 모든 AI 이니셔티브의 생명선이며, 프로젝트의 성공 여부는 모델에 공급되는 데이터의 품질에 달려 있다.” 말했다. 또한 “놀랍게도 의사결정권자 5명 중 3명은 자사 데이터에 대한 이해 부족으로 생성형 AI의 잠재력을 최대한 활용하지 못하고 있다고 답했다. 진정한 잠재력은 문서 처리를 혁신하고 운영 효율성을 향상시킬 수 있는 맞춤형 SLM을 채택하는 데 있다”라고 덧붙였다.
가트너는 기업이 정확성, 견고성, 효율성을 개선하기 위해 특정 요구사항에 맞게 SLM을 맞춤화할 것을 권장한다. 가트너는 “업무 전문화로 정렬을 개선하고, 정적인 기업 지식을 포함하면 비용을 절감할 수 있다. 필요에 따라 동적 정보도 제공할 수 있어 하이브리드 접근 방식은 효과적이고 효율적”이라고 요약했다.
바이오 제약 산업용으로 사전 학습된 생성형 AI 모델을 제공하는 공급업체 와이섭의 CEO 엠마누엘 왈케너는 금융 서비스, 의료 및 제약과 같이 규제가 심한 산업에서 LLM의 미래는 확실히 탄탄하지 않다고 말했다. 또한 더 작고 전문화된 모델을 사용하면 현재 작업에 필요하지 않은 대규모 모델을 구축하는 데 낭비되는 시간과 에너지를 줄일 수 있다고 강조했다.
잠재력은 있지만 아직 성숙하지는 않은
가트너의 찬드라세카란은 “얼마나 많은 에이전트가 높은 기대에 부응할 수 있을지는 불분명하지만, 내년에는 도메인별 AI 에이전트가 늘어날 것”이라고 전망했다.
포레스터에 따르면 에이전트 AI 아키텍처는 떠오르는 최고의 기술이지만, 기대하는 높은 수준의 자동화에 도달하기까지는 아직 2년이 더 남았다.
기업은 AI 에이전트를 통해 복잡한 업무에 생성형 AI를 적용하고자 하지만, 이 기술은 대부분 여러 모델 간의 시너지, 검색 증강 생성(RAG)을 통한 맞춤화, 전문 지식에 의존하기 때문에 여전히 개발하기 어려운 기술이다. 포레스터는 보고서에서 “특정 결과를 위해 이러한 구성 요소를 조정하는 것은 해결되지 않은 장애물이며 개발자가 좌절하기 쉽다”라고 말했다.
최근 업계 전반의 비즈니스 리더와 기술 실무자 4,000명을 대상으로 실시한 캐피털 원(Capital One)의 설문조사에 따르면 87%가 데이터 에코시스템이 대규모 AI를 지원할 준비가 되어 있다고 생각하는 반면, 기술자의 70%는 데이터 문제를 해결하는 데 매일 몇 시간을 소비하는 것으로 나타났다.
그럼에도 불구하고 조사 결과에서 기업 경영진은 자사의 AI 준비 상태를 매우 낙관했다. 특히 87%는 AI 솔루션 확장을 위한 최신 데이터 에코시스템을 갖추고 있다고 답했고, 84%는 데이터 관리를 위한 중앙 집중식 도구와 프로세스를 갖추고 있다고 답했으며, 82%는 AI 도입을 위한 데이터 전략에 확신을 갖고 있고, 78%는 증가하는 AI 기반 데이터의 양과 복잡성을 관리할 준비가 되어 있다고 느낀다고 답했다.
하지만 2025년에 AI 에이전트를 자체적으로 구축하려는 기업의 75%는 실패할 것으로 예상되며, 대신 기존 소프트웨어 공급업체의 컨설팅 서비스나 사전 통합된 에이전트를 선택할 것으로 예상된다. 포레스터 리서치에 따르면 2025년에는 AI 데이터 준비와 현실의 복잡성 사이의 불일치를 해결하기 위해 기업 CIO의 30%가 최고 데이터 책임자(CDO)를 IT 팀에 통합해 AI 이니셔티브를 이끌게 할 것이다. CEO는 성공적인 AI를 위해서는 탄탄한 데이터 기반과 효과적인 이해관계자 협업이 모두 필요하다는 점을 인식하고 기술 및 비즈니스 전문성 간의 격차를 해소하기 위해 CIO에게 의존할 것이다.
포레스터의 2024년 설문조사에서도 고위 데이터 리더의 39%가 CIO에게 보고하며, 비슷한 37%가 CEO에게 보고하는 것으로 나타났으며, 이러한 추세는 점점 더 커지고 있다. AI 성공을 추진하려면 CIO와 CEO는 CDO를 단순한 연락 담당자를 넘어 AI 전략, 변화 관리, ROI 제공의 핵심 리더로 격상시켜야 한다.
멀티모달리티에 대한 관심 증가 및 기술 발전
멀티 모달리티, 특히 생성형 AI 입력과 출력 모두에서 이미지와 음성을 모달리티로 사용하는 새로운 사용례도 2025년에 더 많이 채택될 것이다.
AI의 하위 분야인 멀티모달 학습은 텍스트, 이미지, 비디오, 오디오 등 다양한 데이터 유형에 대한 모델 학습을 통해 머신러닝을 향상시킨다. 이 접근 방식을 통해 모델은 텍스트와 관련 감각 데이터 간의 패턴과 상관관계를 식별할 수 있다.
멀티모달 AI는 여러 데이터 유형을 통합해 지능형 시스템의 기능을 확장한다. 이러한 모델은 다양한 입력 유형을 처리하고 다양한 출력을 생성할 수 있다. 예를 들어 챗GPT의 기반이 되는 GPT-4는 텍스트와 이미지 입력을 모두 받아 텍스트를 출력하고, 오픈AI의 소라(Sora) 모델은 텍스트에서 영상을 생성한다.
또 의료 영상, 환자 이력, 실험실 결과를 통합해 진단 및 치료를 향상하는 예를 들 수 있다. 금융 서비스에서는 멀티모달 AI가 고객의 전화 문의를 분석해 컨택 센터 직원의 문제 해결을 지원할 수 있다. 또한 자동차 산업에서는 테슬라, 웨이모, 리 오토 같은 기업의 자율 주행, 비상 대응, 내비게이션 성능 향상을 위해 카메라, GPS, LiDAR의 입력을 AI로 통합할 수 있다.
또한 AI 경영진은 비즈니스 성과에 우선순위를 두면서 데이터 하우스를 정리하고, AI 인재를 육성해야 한다는 사실을 깨달았다. 특히 후자는 기업의 생성형 AI 요구와 충족할 수 있는 기술을 갖춘 인력 간의 격차가 커지는 상황에서 더욱 중요하다.
포레스터는 보고서에서 “내년에는 효과적인 AI 전략과 실행 계획을 개발하기 위해 현실을 직시해야 한다. 2025년 기업의 성공은 강력한 리더십, 전략적 개선, AI 열망에 걸맞은 기업 데이터 및 AI 이니셔티브의 재조정 여부에 달려 있다”라고 요약했다.
dl-itworldkorea@foundryco.com
Lucas Mearian editor@itworld.co.kr
저작권자 한국IDG & ITWorld, 무단 전재 및 재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.