엔비디아, 로봇의 ‘챗GPT 모멘트’ 선언…글로벌 파트너들과 차세대 로봇 공개


엔비디아(NVIDIA)가 CES 2026에서 피지컬AI(Physical AI)를 위한 새로운 오픈 모델과 프레임워크를 발표하며 로봇 산업의 새 시대를 열었다. 보스턴다이내믹스(Boston Dynamics), 캐터필러(Caterpillar), LG전자, 뉴라 로보틱스(NEURA Robotics) 등 글로벌 기업들이 엔비디아 기술로 구동되는 차세대 로봇을 선보였다.

Nvidia ces 2026 global robotics partners - 와우테일

젠슨 황 엔비디아 창업자 겸 CEO는 “로봇의 ChatGPT 모멘트가 왔다”며 “실제 세계를 이해하고 추론하며 행동을 계획하는 피지컬AI 혁신이 완전히 새로운 가능성을 열고 있다”고 말했다. 그는 엔비디아의 젯슨(Jetson) 로봇 프로세서, CUDA, 옴니버스(Omniverse), 오픈 피지컬AI 모델이 파트너들의 산업 혁신을 뒷받침한다고 강조했다.

엔비디아가 이번에 내놓은 기술들은 로봇 개발 전 과정의 작업 흐름을 빠르게 만들어 여러 작업을 빠르게 배우는 범용 로봇 제작을 앞당기는 데 집중했다. 특히 막대한 자본과 전문성이 드는 파운데이션 모델 구축 부담을 덜어주기 위해, 개발자들이 사전 학습 없이 바로 차세대 AI 로봇 제작에 집중할 수 있도록 오픈 모델을 제공했다.

코스모스(Cosmos): 로봇이 세상을 이해하는 법

엔비디아가 공개한 코스모스는 로봇에게 물리적 세계를 이해시키는 ‘세계 파운데이션 모델’이다. 쉽게 말해 로봇이 현실 세계에서 어떤 일이 일어날지 예측하고, 가상으로 다양한 상황을 만들어내는 AI 엔진이다.

코스모스 트랜스퍼 2.5(NVIDIA Cosmos Transfer 2.5)는 3D 시뮬레이션 환경에서 실제처럼 보이는 영상 데이터를 만들어낸다. 예를 들어 로봇이 공장에서 물건을 나르는 장면을 컴퓨터로 수천 가지 버전으로 생성할 수 있다. 비 오는 날, 어두운 밤, 복잡한 환경 등 다양한 조건의 훈련 데이터를 실제로 촬영하지 않고도 만들 수 있는 것이다.

코스모스 프리딕트 2.5(NVIDIA Cosmos Predict 2.5)는 로봇이 행동한 결과를 미리 시뮬레이션해본다. 로봇에게 “이렇게 움직이면 어떻게 될까?”를 가상으로 테스트해보는 기능이다. 최대 30초 길이의 영상까지 생성할 수 있어, 실제 로봇에 적용하기 전 안전하게 검증할 수 있다.

코스모스 리즌 2(NVIDIA Cosmos Reason 2)는 로봇의 ‘두뇌’ 역할을 한다. 단순히 명령을 따르는 게 아니라, 상황을 보고 이해하며 스스로 판단한다. 예컨대 “저기 있는 물건 가져와”라는 애매한 지시를 받으면, 어떤 물건인지 파악하고 어떻게 접근할지 스스로 계획을 세운다. 허깅페이스의 물리적 추론 리더보드에서 1위를 차지했으며, 다운로드 수가 100만 건을 넘었다.

GR00T: 휴머노이드 로봇의 행동 전문가

아이작 GR00T N1.6(NVIDIA Isaac GR00T N1.6)은 휴머노이드 로봇 전용 AI 모델이다. 사람처럼 생긴 로봇이 팔, 다리, 몸통을 동시에 자연스럽게 움직이도록 만드는 기술이다. 코스모스 리즌을 ‘두뇌’로 사용해 상황을 판단하고, 그에 맞춰 전신을 제어한다.

실제로 프랑카 로보틱스(Franka Robotics), 뉴라 로보틱스, 휴머노이드(Humanoid) 같은 로봇 제조사들이 GR00T로 로봇의 새로운 동작을 가상에서 먼저 훈련시킨 뒤 실제 로봇에 적용하고 있다.

세일즈포스(Salesforce)는 이 기술을 자사 건물 보안에 실제로 활용하고 있다. 세일즈포스 타워에 배치된 코발트(Cobalt) 보안 로봇에 GR00T와 코스모스 리즌을 연결했다. 로봇이 순찰하며 촬영한 영상을 코스모스 리즌이 실시간으로 분석해 열린 문, 보안 위험 같은 문제를 찾아낸다. 발견된 문제는 세일즈포스의 에이전트포스(Agentforce)가 자동으로 담당 기술자를 찾아 슬랙(Slack)으로 배정한다. 그 결과 문 보안 문제 해결 시간이 3분 38초에서 1분 32초로 절반 이상 줄었고, 사람이 개입해야 하는 경우가 100%에서 1%로 급감했다. 세일즈포스 타워 한 곳만 주당 40시간의 경비 인력을 절약했으며, 전 세계적으로는 월 6000시간을 절약할 수 있을 것으로 추정된다.

의료 분야 적용도 빠르다. 렘 서지컬(LEM Surgical)은 코스모스 트랜스퍼로 다이나미스(Dynamis) 수술 로봇의 팔을 훈련시키고 있다. 가상 시뮬레이션으로 수천 번의 수술 동작을 연습시킨 뒤, 실제 수술에 투입하는 방식이다.

아이작 랩-아레나: 로봇 성능 테스트장

아이작 랩-아레나(NVIDIA Isaac Lab-Arena)는 로봇의 능력을 대규모로 평가하는 가상 테스트장이다. 실제 로봇으로 하나하나 테스트하면 시간도 오래 걸리고 비용도 많이 든다. 아이작 랩-아레나는 수백, 수천 가지 시나리오를 컴퓨터 시뮬레이션으로 동시에 돌려볼 수 있다.

리베로(Libero), 로보카사(Robocasa) 같은 업계 표준 벤치마크와 연결돼 있어, 서로 다른 로봇들의 성능을 공정하게 비교할 수 있다. 깃허브(GitHub)에 오픈소스로 공개돼 누구나 무료로 사용할 수 있다.

OSMO: 로봇 개발 총괄 제어실

엔비디아 OSMO는 로봇 개발의 복잡한 과정을 한곳에서 관리하는 플랫폼이다. 로봇을 만들려면 데이터 생성, AI 모델 훈련, 시뮬레이션 테스트 등 여러 단계를 거쳐야 하는데, 각 단계마다 다른 컴퓨팅 환경이 필요하다.

OSMO를 쓰면 개인 워크스테이션부터 클라우드 서버까지 여러 컴퓨팅 자원을 하나의 명령으로 묶어 관리할 수 있다. 마치 여러 공장의 생산라인을 하나의 통제실에서 감독하는 것처럼, 로봇 개발의 전체 흐름을 조율한다. 마이크로소프트 애저 로보틱스 가속기(Microsoft Azure Robotics Accelerator)에도 통합됐다.

허깅페이스 협력: 하드웨어와 소프트웨어의 만남

엔비디아는 AI 오픈소스 플랫폼 허깅페이스(Hugging Face)와 손잡고 아이작과 GR00T 기술을 LeRobot 프레임워크에 통합했다. 얼핏 보면 GR00T와 LeRobot이 비슷한 역할을 하는 경쟁자처럼 보일 수 있지만, 실제로는 보완 관계다.

GR00T는 엔비디아가 만든 ‘사전 학습된 AI 모델’이다. 이미 수많은 로봇 동작 데이터로 훈련돼 있어 기본적인 로봇 동작 능력을 갖추고 있다. 반면 LeRobot은 허깅페이스가 만든 ‘개발 도구 모음’이다. 로봇 데이터를 모으고, AI 모델을 훈련시키고, 성능을 테스트하는 전체 과정을 쉽게 만들어주는 소프트웨어 프레임워크다.

비유하자면 GR00T는 ‘요리를 할 줄 아는 셰프’이고, LeRobot은 ‘주방 도구 세트’다. 셰프가 좋은 도구를 만나면 더 효율적으로 요리할 수 있는 것처럼, GR00T 모델을 LeRobot 프레임워크에서 사용하면 개발자들이 훨씬 쉽게 로봇을 만들 수 있다. LeRobot에서 GR00T 모델을 다운로드받아 자기 로봇에 맞게 미세 조정하고, 여러 모델(GR00T, pi0, SmolVLA 등)의 성능을 같은 환경에서 비교할 수 있다.

이 협력으로 엔비디아의 200만 로봇 개발자 커뮤니티와 허깅페이스의 1300만 AI 개발자 커뮤니티가 연결됐다. 허깅페이스의 오픈소스 휴머노이드 리치 2(Reachy 2)는 젯슨 토르와 완전 호환돼, 개발자들이 다양한 AI 모델을 자유롭게 테스트할 수 있다. 엔비디아는 하드웨어(젯슨 칩)와 AI 모델(GR00T)을 제공하고, 허깅페이스는 이를 쉽게 활용할 수 있는 개발 환경을 제공하는 윈윈 구조다.

젯슨 토르와 T4000: 로봇의 두뇌

휴머노이드 로봇 제조사들이 젯슨 토르(Jetson Thor)를 앞다퉈 채택하고 있다. 젯슨 토르는 로봇 안에 들어가는 초소형 고성능 컴퓨터로, 블랙웰(Blackwell) AI 칩과 128GB 메모리를 탑재해 최대 2070 테라플롭스 성능을 낸다. 이전 세대인 젯슨 오린보다 AI 연산 성능이 7.5배 높고 에너지 효율은 3.5배 개선됐다.

뉴라 로보틱스는 포르쉐가 디자인한 3세대 휴머노이드에 젯슨 토르를 탑재했다. 리치테크 로보틱스(Richtech Robotics)는 복잡한 공장에서 물건을 정밀하게 다루고 이동하는 휴머노이드 덱스(Dex)를 공개했다. LG전자는 집안일을 돕는 가정용 로봇을 선보였고, 보스턴다이내믹스와 휴머노이드는 기존 휴머노이드에 젯슨 토르를 추가해 성능을 높였다.

더 저렴한 옵션도 나왔다. 젯슨 T4000 모듈은 1000개 단위 주문 시 1999달러에 판매된다. 1200 테라플롭스 성능과 64GB 메모리를 갖췄으며, 소비전력은 70와트 이내로 낮춰 배터리로 작동하는 로봇에 적합하다. 이전 세대 대비 4배 빠른 성능을 제공한다.현재 로봇 분야는 허깅페이스에서 가장 빠르게 성장하는 카테고리다. 엔비디아의 오픈 모델과 데이터셋 다운로드 수가 1위를 기록하고 있다.

업계에서는 엔비디아가 스마트폰 업계에서 안드로이드가 차지한 것과 같은 지배적 위치를 로봇 산업에서 확보하려 한다고 분석한다. 캐터필러는 건설과 광산 현장에 AI 자율 장비를 도입하기 위해 엔비디아와 협력을 확대 중이며, 캐터필러 CEO 조 크리드(Joe Creed)가 1월 7일 CES 기조연설에서 구체적인 내용을 공개할 예정이다.

기사 공유하기

답글 남기기