몇몇 오픈소스 프로젝트는 대단히 성공을 거두며 IT 인프라의 표준 구성 요소로 자리 잡는다. 리눅스나 쿠버네티스가 대표적인 예다. 물론 잊혀지는 프로젝트도 있다. 우분투 폰(Ubuntu Phone)을 기억하는가?
오픈텔레메트리는 클라우드 네이티브 컴퓨팅 재단(Cloud Native Computing Foundation, CNCF)의 프로젝트로, 점점 더 많은 주목을 받으며 또 하나의 오픈소스 성공 사례로 자리 잡을 가능성을 보이고 있다. 오픈텔레메트리, 줄여서 Otel은 점점 더 복잡하고 불투명해지는 멀티클라우드 환경에서 네트워크 중단을 방지하고 애플리케이션 성능을 유지해야 하는 네트워크 관리자의 주요 어려움을 해결하는 데 초점을 맞추고 있다.
벤처 캐피털 사파이어 벤처스(Sapphire Ventures)의 파트너 캐스버 왕은 “전통적으로 관찰가능성(observability) 시장은 독점적인 데이터 포맷을 사용하는 기존 업체들이 지배해 왔다. 이는 복잡하고 단절된 모니터링 솔루션 세계를 통합하고 관리하도록 강요하는 락인(lock-in) 현상을 만들어냈다. 시간이 지나면서 커뮤니티는 독점 데이터 포맷의 한계를 인식하고 오픈텔레메트리 프로젝트가 선도하는 개방형 표준에 대한 협력을 시작했다”라고 말했다.
Otel은 로그, 메트릭, 추적이라는 3가지 기본적인 텔레메트리 정보를 수집하는 벤더 중립적인 방법을 제공한다. 로그는 이벤트가 발생한 시점의 타임스탬프다. 로그 분석을 통해 오류나 예측 불가능한 동작을 파악할 수 있다. 메트릭은 자원 활용도와 애플리케이션 성능에 대한 수치 측정을 제공해 네트워크 관리자가 사전에 문제를 예방할 수 있도록 돕는다. 추적은 분산된 클라우드 환경에서 애플리케이션 계층의 성능을 가시화한다.
OTel은 이런 데이터를 벤더 중립적인 단일 소스로 집계한다. 하지만 OTel은 데이터를 저장하거나 이를 분석, 쿼리, 시각화하는 기능을 제공하지 않는다. 수집된 텔레메트리 데이터는 관찰가능성, 네트워크 모니터링, 애플리케이션 성능 관리를 제공하는 백엔드 시스템으로 내보내진다.
OTel이 2025년 주목받을 것으로 예상되는 5가지 이유는 다음과 같다.
통합 관찰가능성 플랫폼의 광범위한 채택
OTel의 성공을 입증하는 핵심 지표 중 하나는 주요 관찰가능성 플랫폼 업체가 OTel 표준에 대한 통합 지원을 제공한다는 사실이다. 2024년 8월 발표된 가트너의 관찰가능성 플랫폼 매직 쿼드런트에 따르면 크로노스피어(Chronosphere), 뉴렐릭, 데이터독, 다이나트레이스(Dynatrace), 서비스나우, 스플렁크, 그리고 수모로직(SumoLogic) 같은 주요 업체가 OTel을 지원한다.
실제로 가트너는 마이크로소프트가 OTel 데이터의 자동 수집을 직접 지원하지 않는 점에서 점수를 깎았다. 보고서에 따르면, 마이크로소프트의 애저 모니터(Azure Monitor)는 콜렉터 인터페이스를 통해 OTel 데이터를 자동으로 가져올 수 없으며, 추가적인 내보내기 도구가 필요하다.
인증 프로그램으로 검증 강화
인증 프로그램은 IT 직원이 새로운 기술을 체계적으로 학습할 수 있는 기회를 제공하며, 더 많은 수익을 올릴 수 있도록 돕는다. 네트워크 관리자가 OTel 활용에 능숙해질수록 OTel은 네트워크 관리자의 기본 도구로 자리 잡는다. CNCF와 리눅스 재단(Linux Foundation)은 분산된 시스템 전반 걸쳐 가시성을 확보하기 위해 OTel 활용에 필요한 기술을 검증하는 오픈텔레메트리 인증 프로그램 OTCA(OpenTelemetry Certified Associate)를 공개했다.
OTCA 프로그램은 애플리케이션 엔지니어, 데브옵스 엔지니어, 시스템 신뢰성 엔지니어, 플랫폼 엔지니어, 또는 클라우드 네이티브 및 마이크로서비스 기반 애플리케이션의 분산 시스템에서 텔레메트리 데이터를 활용하는 능력을 강화하려는 IT 전문가를 대상으로 한다.
리눅스 재단 교육 부문 수석 부사장 겸 총괄 매니저 클라이드 시퍼사드는 “OTCA 인증을 취득하면 현대 IT 운영에서 요구되는 기술을 갖추게 되어 경력을 발전시킬 수 있다. 이 기술은 복잡하고 분산된 시스템 시대에서 능동적이고 문제 해결에 뛰어난 전문가로 자리 잡을 수 있도록 해준다”라고 설명했다. OTCA 시험 비용은 250달러(약 36만 2,000원)다. 2025년 1월부터 시험 일정을 잡을 수 있다.
OTel의 CI/CD 파이프라인 확장
OTel은 처음에는 클라우드 네이티브 애플리케이션을 대상으로 개발됐지만, 오픈텔레메트리 내에서 CI/CD(Continuous Integration/Continuous Delivery) 애플리케이션 개발 파이프라인에 초점을 맞춘 특별 이익 집단(Special Interest Group)이 결성되면서 OTel은 더욱 강력한 엔드투엔드 도구로 발전하고 있다.
프로젝트 리더 도탄 호로비츠는 “CI/CD 관찰가능성은 소프트웨어가 효율적이고 신뢰할 수 있게 프로덕션 단계로 배포되도록 보장하는 데 필수적이다. 관찰가능성을 CI/CD 워크플로에 통합함으로써 팀은 파이프라인의 상태와 성능을 실시간으로 모니터링하고 병목 현상과 개선이 필요한 부분에 대한 통찰을 얻을 수 있다”라고 말했다.
또한 호로비츠는 개방형 표준이 중요한 이유에 대해 “도구와 업체에 구애받지 않는 공통의 통합 언어를 만들어내기 때문이다. 서로 다른 도구 사이에서 일관된 관찰가능성을 확보하고, 팀이 CI/CD 파이프라인 성능에 대해 명확하고 포괄적인 시각을 유지할 수 있도록 해준다”라고 덧붙였다.
비즈니스 데이터와의 통합
원시 텔레메트리 데이터를 네트워크 성능과 연관시키는 것도 중요하지만, 이를 비즈니스 관점에서 분석하는 것은 기업에 있어 더욱 중요한 과제다.
사파이어 벤처스의 왕은 “제품 경험 모니터링과 시스템 모니터링 도구는 전통적으로 별개의 영역에서 작동해 왔다. 최근에는 최종 사용자 행동과 시스템 수준 신호 사이의 상관관계를 더 잘 이해하기 위해 이 두 영역을 통합하려는 움직임이 늘어나고 있다”라고 말했다.
OTel은 이런 통합을 가능하게 한다. 가령 특정 앱이나 기능에서 고객 이용률이 감소하는 상황이라고 가정해 보자. 고객이 해당 기능을 좋아하지 않아 개선이 필요한 것인지, 아니면 느리거나 불규칙한 네트워크 응답 시간이 고객을 떠나게 만드는 것인지 파악할 수 있다.
뉴렐릭이 1,700명의 기술 전문가를 대상으로 의뢰한 최근 설문조사에 따르면, 응답자 35%가 최소 5가지 이상의 비즈니스 관련 데이터 유형을 텔레메트리 데이터와 통합했다고 답했다. 가장 인기 있는 데이터 유형으로는 고객 데이터, 생산 데이터, 판매 데이터, 재고 데이터, 마케팅 데이터, 물류 데이터, 그리고 인사 데이터가 포함됐다.
AI 효과
AI, 생성형 AI, 그리고 LLM에 대한 관심이 폭발적으로 증가하면서 기업 네트워크에서 생성, 처리, 전송되는 데이터의 양이 급증하고 있다. 즉, AI 시스템이 효율적으로 운영되고 있는지 확인하기 위해 수집해야 하는 텔레메트리 데이터의 양도 크게 증가했다는 의미다.
OTel이 벤더 중립적이고 업계 전반에 걸친 표준으로 자리 잡은 이유는 데이터 집약적이고 실시간 처리가 요구되는 AI 애플리케이션의 병목 현상이나 기타 성능 문제를 탐지하는 데 있어 OTel이 핵심적인 역할을 해서다. 최종 사용자가 데이터베이스에 쿼리를 보내고 빠른 결과를 기대하는 AI 애플리케이션에서 이런 점은 특히 중요하다.
반대로 AI 분석의 힘을 활용해 네트워크 관리자가 일상적인 운영을 최적화하고 자동화할 수 있는 AI옵스(AIOps)의 발전도 주목할 만하다. 벤더 중립적인 텔레메트리 데이터 스트림을 제공하는 OTel 데이터는 AI옵스의 핵심 기반이다.
dl-itworldkorea@foundryco.com
Neal Weinberg editor@itworld.co.kr
저작권자 한국IDG & ITWorld, 무단 전재 및 재배포 금지
이 기사의 카테고리는 언론사의 분류를 따릅니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.