<이미지를 클릭하시면 크게 보실 수 있습니다> |
알리바바그룹이 최신 추론 모델 'Qwen3-Max-Thinking'을 공개했다.
Qwen3-Max-Thinking은 1조 개 이상의 파라미터로 모델 규모를 확장하고, 강화학습을 통해 사실적 지식 처리, 복합 추론, 지시 수행, 에이전트 기능 등의 성능을 향상시켰다. 알리바바에 따르면 19개 주요 벤치마크 평가에서 Claude Opus 4.5, Gemini 3 Pro, GPT-5.2-Thinking-xhigh 등과 비교해 경쟁력 있는 성능을 기록했다.
주요 기술로는 적응형 도구 활용(Adaptive Tool-use) 기능과 테스트 단계 확장(Test-time Scaling) 기법이 적용됐다. 적응형 도구 활용 기능은 사용자가 도구를 직접 선택하지 않아도 모델이 상황에 따라 검색, 메모리, 코드 인터프리터를 자동으로 호출해 활용한다. 검색 및 메모리 기능은 환각(Hallucination)을 줄이고 실시간 정보 접근성을 높이며, 코드 인터프리터는 계산 기반 추론이 필요한 문제 해결을 지원한다.
알리바바는 경험 누적형 다회차 테스트 단계 확장 전략도 도입했다. 이전 상호작용에서 도출된 핵심 정보를 정제·활용해 이미 알려진 결론을 반복 추론하지 않고 남은 불확실성 해결에 집중하도록 설계했다.
Qwen3-Max-Thinking은 Qwen Chat을 통해 제공되며, 모델 API는 알리바바의 생성형 AI 개발 플랫폼 '모델 스튜디오(Model Studio)'에서 이용할 수 있다.
글 : 허민혜(min3hui4@platum.kr)
ⓒ '스타트업 전문 미디어 & 중화권 전문 네트워크' 플래텀, 조건부 전재 및 재배포 허용
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
