구글, 로봇 제어를 위한 ‘제미나이 로보틱스’ 출시


구글 딥마인드(Google DeepMind)가 로봇공학을 위해 설계된 ‘제미나이 로보틱스(Gemini Robotics)’를 공개했다. 이 새로운 AI 모델은 제미나이 2.0을 기반으로 개발되었으며, 물리적 세계에서 작동하는 차세대 로봇의 기초를 다지는 역할을 할 전망이다.

google gemini robotics - 와우테일

구글 딥마인드(Google DeepMind)는 제미나이 2.0을 기반으로 두 가지 새로운 AI 모델을 발표했다. 첫 번째는 ‘제미나이 로보틱스(Gemini Robotics)’로, 고급 시각-언어-행동(VLA) 모델이며 물리적 행동을 새로운 출력 방식으로 추가하여 로봇을 직접 제어할 수 있도록 설계되었다. 두 번째는 ‘제미나이 로보틱스-ER(Gemini Robotics-ER)’로, 향상된 공간 이해 능력을 갖춘 모델이며 로봇공학자들이 제미나이의 체화된 추론(ER) 능력을 활용해 자체 프로그램을 실행할 수 있도록 한다.

두 모델 모두 다양한 로봇이 이전보다 더 넓은 범위의 실제 작업을 수행할 수 있게 한다. 구글(Google)은 이러한 노력의 일환으로 휴머노이드 로봇 개발 기업 앱트로닉(Apptronik)과 협력하여 제미나이 2.0을 탑재한 차세대 휴머노이드 로봇을 구축하고 있다. 구글은 지난 2월 앱트로닉의 3.5억 달러 투자에 참여한 바 있다. 

로봇용 AI 모델이 사람들에게 유용하고 도움이 되기 위해서는 일반성, 상호작용성, 정교함이라는 세 가지 주요 특성이 필요하다. 제미나이 로보틱스는 세 가지 측면 모두에서 상당한 성능 향상을 이루어냈다. 구글 딥마인드(Google DeepMind)의 기술 보고서에 따르면, 제미나이 로보틱스는 종합적인 일반화 벤치마크에서 다른 최첨단 시각-언어-행동 모델보다 평균적으로 2배 이상의 성능을 보여주었다.

제미나이 로보틱스는 제미나이의 고급 언어 이해 능력을 활용하여 일상적이고 대화체로 표현된 명령과 다른 언어로 된 명령도 이해하고 응답할 수 있다. 또한 지속적으로 주변을 모니터링하여 환경이나 지시사항의 변화를 감지하고 그에 따라 행동을 조정한다.

YouTube 동영상

이 모델은 종이접기나 지퍼백에 간식을 넣는 것과 같이 정밀한 조작이 필요한 복잡한 작업도 처리할 수 있다. 또한 다양한 로봇 유형에 쉽게 적응할 수 있도록 설계되어, ALOHA 2의 양팔 로봇 플랫폼부터 프랑카(Franka) 로봇 팔, 앱트로닉(Apptronik)의 휴머노이드 아폴로(Apollo) 로봇까지 제어할 수 있다.

제미나이 로보틱스-ER은 제미나이 2.0의 기존 포인팅 및 3D 감지와 같은 능력을 크게 향상시킨다. 이 모델은 인식, 상태 추정, 공간 이해, 계획 및 코드 생성을 포함하여 로봇을 제어하는 데 필요한 모든 단계를 즉시 수행할 수 있으며, 제미나이 2.0보다 2~3배 높은 성공률을 달성한다.

구글(Google)은 로봇과 주변 사람들의 물리적 안전을 위해 충돌 회피, 접촉력 크기 제한, 이동 로봇의 동적 안정성 보장 등 다양한 안전 조치를 마련했다. 또한 아이작 아시모프의 로봇 3원칙에서 영감을 받은 로봇 헌법과 ASIMOV 데이터셋을 개발하여 로봇 행동의 안전성을 높이고 있다.

구글(Google)은 앱트로닉(Apptronik) 외에도 애자일 로봇(Agile Robots), 애질리티 로봇(Agility Robots), 보스턴 다이내믹스(Boston Dynamics), 인챈티드 툴즈(Enchanted Tools)를 포함한 여러 기업들과 협력하여 제미나이 로보틱스-ER 모델을 테스트하고 있다. 이를 통해 더 유용한 차세대 로봇을 위한 AI 개발을 계속해 나갈 계획이다.

기사 공유하기

답글 남기기