<이미지를 클릭하시면 크게 보실 수 있습니다> |
◆로봇의 '두뇌'를 완성하다…구글의 제미나이 로보틱스·ER 1.5
구글 AI 조직 구글 딥마인드는 24일(현지시간) 로봇의 추론 능력을 획기적으로 향상한 AI 모델 ▲제미나이 로보틱스 1.5와 ▲ER 1.5를 공개했습니다. 지난 3월 제미나이 로보틱스를 처음 공개한 후 반년 만에 이뤄진 업데이트인데요.
로봇의 두뇌 역할을 하는 이 모델들은 단순히 주어진 명령만 따르지 않습니다. 상황을 스스로 파악하고 판단해 여러 행동을 연속적으로 수행하죠. 구글은 이 두 모델을 로봇 에이전트의 '체화인지모델'과 '시각언어모델'로 구분했습니다.
ER 1.5는 복잡한 계획과 추론을 담당하는 고차원적 계획을 맡고, 제미나이 로보틱스 1.5는 물체 인식과 지시를 물리적 행동으로 옮기는 역할을 합니다. 마치 사람이 생각하고 행동하듯 이 두 모델이 협력해 로봇의 움직임을 제어하는 셈이죠.
예를 들어 "쓰레기 분리수거를 해줘"라는 명령을 받은 로봇은 ER 1.5의 추론 능력을 활용해 사용자의 위치와 지역별 분리수거 규정을 인터넷에서 검색합니다. 이후 제미나이 로보틱스 1.5를 통해 쓰레기를 정확히 인식하고 분류하는 물리적 작업을 수행하죠.
이번에 공개된 제미나이 로보틱스 1.5는 벤치마크 테스트에서 62.8점을 기록하며 이전 버전은 물론, 오픈AI의 GPT-5 모델들보다도 높은 점수를 받았습니다. 이는 복잡한 명령을 여러 단계로 나누어 처리하는 능력이 크게 향상되었음을 보여줍니다.
◆매일 아침 찾아오는 AI 비서…오픈AI의 챗GPT 펄스
<이미지를 클릭하시면 크게 보실 수 있습니다> |
사용자의 대화 기록, 캘린더, 이메일 연동 정보 등을 종합해 개인 맞춤형 업데이트를 이미지와 텍스트가 담긴 '카드' 형태로 제공합니다. 회의 안건 초안, 건강식 메뉴, 주말 행사 추천 등 다양하고 실생활에 밀착된 제안을 건네죠. 이전 대화를 통해 이용자가 달리기를 좋아한다는 사실을 학습했다면 다가오는 런던 여행 일정에 달리기 코스를 자동으로 포함하는 식입니다.
펄스의 핵심은 복잡한 사고 과정을 거쳐 답을 도출하는 오픈AI의 추론 모델입니다. 이 모델은 과학, 코딩, 수학 문제 해결에 강점을 보여왔는데요. 이제 사용자의 일상 데이터를 기반으로 더 정교한 제안을 만드는 데 활용됩니다. 펄스 기능은 월 200달러의 챗GPT 프로(Pro) 모바일 요금제 사용자에게 우선 제공될 예정이죠.
구글은 AI를 로봇의 물리적 움직임에 접목했고, 오픈AI는 AI를 개인의 삶을 능동적으로 돕는 에이전트로 확장했습니다. 글로벌 대표 빅테크인 두 기업의 이러한 행보는 AI 경쟁이 새로운 국면에 접어들었음을 명확히 보여줍니다.
누가 더 사람처럼 말하는 AI를 만드는가는 더 이상 중요하지 않습니다. 앞으로는 AI를 '물리적(피지컬) 세계'와 '개인의 일상'에 얼마나 잘 접목하는지가 관건일 겁니다. 우리 집 로봇이 아침에 커피를 타 주고, AI 비서가 하루 일정을 완벽하게 관리해 주는 미래가 얼마나 빨리 현실이 될까요? 구글과 오픈AI가 쏘아 올린 이 신호탄이 어디까지 날아갈지 지켜봐야겠습니다.
- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -
이 기사의 카테고리는 언론사의 분류를 따릅니다.
기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.
