"독자 AI 모델, 오픈소스 활용은 정상…'표기 누락'이 문제"[only이데일리]

이데일리 원문
이소현
입력

2026.01.06 17:09

최종수정

2026.01.06 19:39

주소복사가 완료되었습니다

성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄 인터뷰①

"독자성 논쟁의 기준은 '프롬 스크래치'가 아니라 '투명한 공개'"

"GPU 물량전·벤치마크 줄세우기, 실사용성과 비용 효율 놓친다"

[이데일리 이소현 기자] “오픈소스를 쓰는 건 정상적인 개발 과정입니다. 문제는 남의 것을 썼을 때 출처를 명확히 밝혀야 한다는 겁니다.”

성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄은 ‘독자 AI 파운데이션 모델’에 대한 베끼기 논쟁을 두고, 오픈소스 활용 여부가 아니라 개발 과정의 투명성이 핵심 기준이 돼야 한다고 강조했다.

그는 5일 경기 성남시 네이버 그린팩토리에서 진행한 이데일리 인터뷰에서 “무엇을 어떤 조건으로 썼는지 공개하는 것이 논쟁의 출발점”이라며 “숨기는 순간 신뢰는 무너진다”고 말했다.

성낙호 네이버클라우드 하이퍼스케일 AI 기술총괄이 5일 경기 성남시 네이버 그린팩토리에서 이데일리와 인터뷰를 진행하고 있다.(사진=이영훈 기자)

최근 논쟁은 국가 예산 2000억원이 투입되는 ‘독자 AI 파운데이션 모델’ 과제 참여 기업인 업스테이지의 ‘솔라 오픈 100B’를 두고 ‘중국 모델(GLM) 베끼기’ 의혹이 제기되면서 촉발됐다.

이후 모델 가충치 논란에 대한 공개 검증과 의혹 제기자의 사과를 거치며 ‘모델 유사성’ 논점은 일단 진정되는 흐름을 보였다. 다만 이 과정에서 업스테이지가 사용한 추론(인퍼런스) 코드의 원저작자 표기(중국 GLM 표기 등)를 초기 단계에서 꼼꼼히 챙기지 못했다고 인정한 대목은, 논쟁의 초점을 ‘유사성’에서 ‘투명성’으로 옮겨놓았다는 평가가 나온다.

성 총괄은 “오픈AI도 구글의 트랜스포머를 바탕으로 발전해 왔다”며 “프롬 스크래치 여부나 ‘남의 것을 썼느냐’만으로 독자성을 재단하는 건 기술적으로도 산업적으로도 생산적이지 않다”고 선을 그었다. 대신 그는 독자성을 둘러싼 최소한의 규범으로 ‘표기’와 ‘공개’를 제시했다. “학계에서 인용 표기가 기본이듯, AI도 라이선스 명기와 출처 공개는 기본 규범”이라는 취지다.

그는 업스테이지의 라이선스 표기 누락을 언급하며 “이런 부분이 반복되면 생태계 신뢰가 흔들린다”고 지적했다. 성 총괄은 “외부 모델이나 구성요소를 가져다 썼다는 사실을 알리지 않거나, 이름을 바꿔 독자 개발인 것처럼 설명하려는 행위도 경계해야 한다”고 말했다. 같은 맥락에서 업스테이지가 독자 모델(솔라 오픈 100B) 해명 과정에서 대형언어모델(LLM) ‘솔라 프로2’가 미스트랄 모델 기반이라고 이제와서 처음 밝힌 점도 거론하며 “기술적으로 무엇을 썼느냐보다, 그 사실을 투명하게 밝혔는지가 더 중요하다”고 덧붙였다.

성 총괄은 네이버클라우드 사례를 들어 ‘투명성 기준’을 강조했다. 그는 하이퍼클로바X 시드 32B 싱크 모델 개발 과정에서 중국 알리바바의 큐웬 2.4 언어모델과 비전 인코더를 활용한 사실을 언급하며 “기술 선택과 라이선스 정보를 허깅페이스와 테크리포트로 공개해왔다”고 말했다. 이어 “어떤 비전 인코더를 썼는지, 어떤 언어모델 계열을 기반으로 했는지 같은 정보는 선택 사항이 아니라 책임의 영역”이라며 “국가적 사업일수록 더 엄격한 투명성 기준이 필요하다”고 강조했다.

그는 논쟁의 또 다른 축으로 ‘평가 방식’도 짚었다. ‘국가대표 AI’를 뽑는 독자 파운데이션 모델 프로젝트가 GPU 물량 경쟁이나 벤치마크 점수 줄세우기로 흐를 경우, 정작 현장에 필요한 능력을 놓칠 수 있다는 것이다. 성 총괄은 “투입 자원과 체급을 고려하지 않고 점수만 비교하면 라이트급과 헤비급을 같은 링에 올려놓고 누가 힘이 세냐고 묻는 격”이라고 비판했다. 벤치마크 점수 경쟁이 과열될수록 특정 문제풀이에 최적화된 모델이 유리해지고, 실제 현장에서 중요한 일반화·응용력·비용 효율이 뒷전으로 밀릴 수 있다는 설명이다.

네이버 역시 초창기 개발에서 “규모만 키우다 비용만 소모했던 시행착오”가 있었다고 언급하며, “작은 체급에서 지능의 효율성을 먼저 증명하는 기본기가 갖춰져야 스케일업도 의미가 있다”고 했다. 그는 “토론이 생산적이려면 ‘오픈소스를 썼느냐’가 아니라 ‘투명하게 밝혔느냐’, ‘실제로 쓸 수 있느냐’로 기준이 이동해야 한다”고 말했다.

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

뉴스

AI 이슈 트렌드

02.25 (수)

"독자 AI 모델, 오픈소스 활용은 정상…'표기 누락'이 문제"[only이데일리]

이데일리 주요 뉴스