호스피탈리티 특화 멀티모달 AI 모델
자체 학습 데이터셋 구축 및 모델 허깅 페이스 공개
<이미지를 클릭하시면 크게 보실 수 있습니다> |
[서울=뉴시스]오동현 기자 = 호스피탈리티 인공지능(AI) 기업 온다(ONDA)가 자체 개발한 멀티모달 AI 모델을 허깅 페이스(Hugging Face)에 공개하며, 국내 숙박 산업에서 실증된 AI 기술력을 입증했다고 18일 밝혔다.
이번에 공개된 모델은 8000여 장의 자체 구축 객실 이미지 데이터셋과 한국어 특화 자연어처리 기술을 결합한 하이브리드 AI로써 서로 다른 공급사로부터 제공되는 객실 정보를 자동으로 표준화해 96.5%의 높은 정확도를 달성했다.
온라인여행사(OTA)를 비롯한 숙박 유통 플랫폼은 다수의 공급사로부터 동일 호텔의 객실 데이터를 수집하지만, 공급사마다 객실명 표기 방식이 상이해 심각한 데이터 불일치 문제가 발생한다.
예를 들어 동일한 객실이 A 공급사에서는 '디럭스룸·킹사이즈침대 1개(West tower)'로, B 공급사에서는 '킹룸 - 클럽 이용 가능, 웨스트 타워'로 표기되는 식이다. 이러한 불일치는 중복 재고 생성, 이미지 미스매칭, 고객 혼란을 초래하며 플랫폼 운영 효율성을 저해하는 구조적 문제로 지적돼 왔다.
온다는 이 문제를 해결하기 위해 비전 트랜스포머(ViT) 기반의 이미지 분류 모델과 한국어 특화 언어모델(KLUE BERT)을 결합한 하이브리드 아키텍처를 설계했다.
이미지 모델은 침실, 거실, 욕실 등 객실 구성요소를 자동 인식하도록 학습되었으며, 텍스트 모델은 '디럭스', '오션뷰', '얼리체크인' 등 숙박 도메인의 특화 용어의 의미를 분석하여 객실 유사도를 정밀하게 측정한다.
또 두 모델의 출력값을 가중 융합(weighted fusion)해 최종 유사도 점수를 산출하는 앙상블 기법을 적용, 동일한 침대 이미지를 사용하나 뷰가 다른 객실처럼 단일 이미지나 텍스트로는 구분이 어려운 엣지 케이스에서도 높은 정확도를 유지했다.
온다는 AI의 한계를 인정하고, 신뢰도 기반 하이브리드 워크플로우를 구축했다. 모델이 산출한 각 예측 결과에 신뢰도 점수를 부여하고, 설정된 기준 점수 이하의 케이스는 숙박 도메인 전문가가 최종 검토하는 AI-전문가 협업 구조를 도입해 실무 환경에서의 안정성과 신뢰성을 동시에 확보했다.
온다는 지난 2016년 설립 이후 국내 3만7000개 숙박업소, 71개 유통 채널을 연결하며 연간 수백만 건의 실거래 데이터를 축적해왔다. 이번에 개발된 AI 모델은 독보적인 데이터 자산을 기반으로 하며, 향후 객실 속성 자동 태깅, 가격 최적화, 재고 예측 등으로 확장 가능한 AI 플랫폼의 핵심 기반 기술이다.
오현석 온다 대표는 "AI 시대에 진짜 경쟁력은 모델 자체가 아니라 모델을 학습시킬 수 있는 양질의 도메인 데이터와 실무 적용 능력"이라며 "온다는 8년간 쌓아온 데이터와 호스피탈리티 산업에 대한 깊은 이해를 바탕으로, 실제로 작동하는 AI를 만들 수 있는 몇 안 되는 기업"이라고 강조했다.
온다는 향후 이 기술을 확장해 객실 어메니티 자동 인식, 뷰 타입 분류, 이미지 품질 평가 등 다양한 AI 기반 자동화 솔루션을 상용화할 계획이다.
☞공감언론 뉴시스 odong85@newsis.com
▶ 네이버에서 뉴시스 구독하기
▶ K-Artprice, 유명 미술작품 가격 공개
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
