안녕하세요. 와우파트너스입니다. 와우파트너스는 지난 2월에 립스(LIPS) 운영사에 선정되었습니다. 립스(LIPS)는 Lifestyle business Incubating Program for Strong Enterprise의 약자로, 로컬(Local) 및 라이프스타일(Lifestyle) 분야 창업자를 지원하는…
AI가 변호사 시험을 통과하고 소설을 쓰는 시대다. 그런데 얀 르쿤(Yann LeCun)은 이렇게 물었다. “다섯 살짜리 아이가 할 수 있는 것조차 못 하는 AI를 지능이라 부를 수 있나?” 컵을 들어 물을 따르고, 공이 어디로 튈지 예측하고, 처음 보는 공간을 자유롭게 탐색하는 것. 지금의 대형언어모델(LLM)은 이런 일을 할 수 없다. 텍스트 패턴에서 정답을 추론하는 것과, 물리 세계가 어떻게 작동하는지 이해하는 것은 근본적으로 다른 문제이기 때문이다.
월드모델은 이 간극을 좁히려는 시도다. ‘다음 단어’를 예측하는 LLM과 달리, 월드모델은 ‘다음 상태’를 예측한다. 중력, 공간 관계, 인과관계를 내부적으로 시뮬레이션하며 세계가 어떻게 변화할지를 모델링한다. 로봇이 물건을 잡기 전에 결과를 예측하고, 자율주행차가 낯선 도로를 처음 보고도 안전하게 주행하며, 의사가 수술 시뮬레이션으로 위험을 줄일 수 있다면 — 그 배후에는 월드모델이 있다.
월드모델과 피지컬 AI(Physical AI)는 자주 혼용되지만 엄밀히 다르다. 피지컬 AI는 로봇·자율주행차처럼 실제 몸체를 가지고 물리 세계에서 행동하는 AI 시스템 전반을 가리키는 넓은 개념이다. 월드모델은 그 안에 들어가는 핵심 부품이다. 로봇이 물건을 집기 전에 결과를 머릿속으로 시뮬레이션하고, 자율주행차가 처음 보는 교차로에서 상황을 예측하는 것 — 이 ‘시뮬레이션하는 능력’ 자체가 월드모델이다. 피지컬 AI가 몸이라면, 월드모델은 그 안의 공간 지각 능력이다. 동시에 월드모델은 로봇에만 국한되지 않는다. 게임 엔진, 영화 VFX, 의료 시뮬레이션, 건축 설계 등 물리 세계를 가상으로 재현해야 하는 모든 곳에서 쓰인다.
2026년 들어 이 분야에 자금이 폭발적으로 몰리고 있다. AMI 랩스, 월드랩스, 웨이브(Wayve) 세 곳이 각각 10억 달러 이상을 유치하며 월드모델이 단순한 연구 주제에서 투자 경쟁의 중심으로 이동했다는 신호를 보냈다. 와우테일이 이 프로젝트에서 추적해온 월드모델 관련 플레이어들을 한데 모아 지형도로 정리한다.
1. 순수 월드모델: 공간 지능과 시뮬레이션
물리 세계를 이해하고 3D 환경을 생성·시뮬레이션하는 데 집중하는 플레이어들이다. 로봇이나 자동차처럼 특정 하드웨어에 종속되지 않고, 다양한 산업에 응용 가능한 범용 기반 기술을 구축한다.
월드랩스(World Labs)
‘딥러닝의 대모’로 불리는 페이페이 리(Fei-Fei Li) 스탠퍼드 교수가 2024년 설립한 월드랩스는 AI에 ‘공간 지능(spatial intelligence)’을 부여하는 것을 목표로 한다. 언어 모델이 텍스트를 이해하듯, 3D 공간을 이해하고 추론하는 AI를 만들겠다는 구상이다.
2026년 2월 AMD, 엔비디아(NVIDIA), 오토데스크(Autodesk), 피델리티(Fidelity) 등으로부터 10억 달러를 유치했으며, 누적 조달액은 11억 달러를 넘어섰다. 첫 상용 제품인 마블(Marble)은 텍스트나 이미지 입력만으로 지속 가능하고 편집 가능한 3D 환경을 생성하며, 게임·VFX·로봇·건축 설계 분야를 공략하고 있다. 오토데스크가 2억 달러를 단독 투자한 것은 3D 설계 소프트웨어 산업이 월드모델과의 융합을 얼마나 진지하게 바라보고 있는지를 보여준다.
AMI 랩스(AMI Labs)
‘딥러닝의 대부’ 얀 르쿤이 12년간 몸담은 메타(Meta)를 떠나 설립한 AMI 랩스는 월드모델 분야에서 가장 많은 주목을 받는 신생 기업이다. 2026년 3월 유럽 역사상 최대 규모 시드 라운드로 10억 달러를 유치했으며, 기업가치는 35억 달러로 평가받았다.
르쿤이 메타 재직 시절 고안한 JEPA(Joint Embedding Predictive Architecture) 아키텍처를 중심으로 개발 중이다. LLM이 ‘다음 단어’를 예측하는 것과 달리, JEPA는 추상적인 표현 공간에서 세계의 ‘다음 상태’를 예측한다. 공이 튀는 장면을 픽셀 단위로 계산하는 대신, 중력과 탄성이라는 물리적 직관으로 결과를 예측하는 방식이다. 첫 파트너는 의료 AI 스타트업 나블라(Nabla)로, LLM의 고질적 환각 문제가 생사와 직결되는 의료 현장에 더 신뢰할 수 있는 대안을 제시하는 것이 목표다.
구글 딥마인드(Google DeepMind) — 프로젝트 지니
구글 딥마인드는 2024년 2D 게임 환경을 생성하는 지니 1(Genie 1)을 시작으로, 2024년 말 3D 환경 생성과 물리 시뮬레이션이 가능한 지니 2(Genie 2)를 선보였다. 2025년 공개된 지니 3(Genie 3)는 텍스트 명령만으로 실시간 탐색이 가능한 720p, 초당 24프레임 포토리얼리스틱 환경을 생성하며 월드모델의 실용화 가능성을 처음으로 대중에게 보여줬다. 2026년 1월 구글 AI 울트라(Google AI Ultra) 구독자를 대상으로 ‘프로젝트 지니’라는 이름으로 일반 공개됐다. 월드모델이 연구소 밖으로 나온 첫 번째 소비자 제품 사례다.
GWM은 세 가지 특화 버전으로 구성된다. GWM Worlds는 게임·VFX·AI 에이전트 훈련을 위한 탐색 가능한 환경을 실시간으로 생성한다. GWM Robotics는 로봇 훈련을 위한 합성 데이터를 만들며, GWM Avatars는 교육·고객 서비스용 대화형 캐릭터를 구현한다. 런웨이는 미디어·엔터테인먼트 분야의 탄탄한 고객 기반을 유지하면서 로봇·게임·생명과학으로 응용을 확장하는 독특한 포지션을 취하고 있다. 최근에는 1,000만 달러 벤처 펀드를 조성하고, 자사 월드모델 API를 활용하는 스타트업 빌더 프로그램을 출범시키며 생태계 구축에 나섰다.
디카트(Decart)
2025년 1억 달러를 유치하며 기업가치 31억 달러를 인정받은 디카트는 월드모델을 게임 환경에 구현한 독특한 사례로 주목받았다. 마인크래프트 환경을 실시간 월드모델로 구현한 ‘Oasis’를 선보이며 생성형 AI가 기존 게임 엔진을 대체할 수 있음을 증명했다. 생성 속도와 일관성 면에서 기존 비디오 생성 모델과 차별화되며, GPU 대신 AWS 트레이니엄(Trainium) 칩을 활용해 절반의 비용으로 4배 빠른 추론을 달성하는 성과도 거뒀다.
제너럴인튜이션(General Intuition)
게임 클립 플랫폼 메달(Medal)에서 스핀오프한 AI 연구소 제너럴인튜이션은 매년 20억 개씩 쌓이는 게임 플레이 영상으로 AI에게 공간 인지와 시간적 추론을 학습시킨다. 2025년 코슬라벤처스·제너럴카탈리스트 공동 주도로 게임 업계 역사상 최대 규모인 1억 3,370만 달러 시드를 유치했다. 다른 월드모델 기업들이 모델 자체를 제품으로 파는 것과 달리, 제너럴인튜이션은 이를 내부 학습 도구로만 쓰고 게임 봇·NPC와 수색구조 드론 응용에 집중한다.
2. 자율주행용 월드모델: 현실 세계의 극한 테스트베드
자율주행은 월드모델의 가장 절박한 수요처다. 실제 도로에서 희귀 사고 상황을 재현하기란 불가능하지만, 월드모델로 생성한 시뮬레이션에서는 폭설, 역주행, 갑작스러운 보행자 난입 같은 엣지 케이스를 무한 반복 학습할 수 있다.
웨이브(Wayve)
영국 런던에 본사를 둔 웨이브는 자율주행 전용 월드모델의 가장 발전된 사례로 꼽힌다. GAIA 시리즈(GAIA-1 → GAIA-2 → GAIA-3)를 순차적으로 개발하며 자율주행 시뮬레이션을 진화시켜왔다. 2025년 12월 공개된 GAIA-3는 150억 파라미터 규모로, 단순 시각 합성을 넘어 자율주행 AI의 안전 평가와 검증에 특화됐다. 토네이도, 홍수 같은 극한 상황까지 시뮬레이션해 실제 도로에서 재현 불가능한 안전 테스트를 가능하게 한다.
2026년 2월 마이크로소프트, 엔비디아, 우버, 메르세데스-벤츠, 닛산, 스텔란티스가 참여한 시리즈D로 12억 달러(총 15억 달러)를 조달하며 기업가치 86억 달러를 달성했다. 2026년 런던에서 우버와 함께 로보택시 상용 서비스를 시작하고, 2027년부터는 닛산 차량에 AI 드라이버 소프트웨어를 탑재한다. 특정 도시 지도나 하드웨어에 의존하지 않고 전 세계 500개 이상 도시에서 지도 없이 주행(zero-shot)할 수 있다는 점이 경쟁사와의 핵심 차별점이다.
엔비디아 알파마요(NVIDIA Alpamayo)
엔비디아는 CES 2026에서 자율주행 전용 오픈 AI 모델 패밀리 알파마요(Alpamayo)를 공개했다. 코스모스 기반의 10억 파라미터 VLA(Vision-Language-Action) 추론 모델인 알파마요-R1이 핵심이다. 단순히 센서 입력에 반응하는 것을 넘어, 복잡한 교차로나 신호등 고장 상황에서 사람처럼 “왜 이 판단을 내렸는가”를 설명하며 행동한다. 오픈소스로 공개되어 웨이브, 메르세데스, 우버 등이 자사 시스템에 활용 가능하다.
알파마요와 함께 제공되는 시뮬레이터 알파심(AlpaSim)과 1,700시간 이상의 자율주행 데이터셋을 통해, 개발사들은 실제 도로 주행 없이도 모델을 훈련하고 검증할 수 있다. 2026 메르세데스-벤츠 CLA가 알파마요를 탑재한 첫 양산 차량이 된다.
3. 로봇용 월드모델: 합성 데이터로 실세계를 정복한다
로봇이 실제 환경에서 작동하려면 막대한 훈련 데이터가 필요하다. 월드모델은 이 데이터를 가상 환경에서 무한 생성하는 엔진 역할을 한다.
엔비디아 코스모스(NVIDIA Cosmos)
알파마요가 자율주행 응용 레이어라면, 코스모스는 그 아래 인프라 레이어다. 2,000만 시간 분량의 실세계 데이터로 학습된 코스모스는 로봇·자율주행 시스템 훈련에 필요한 합성 데이터를 생성하는 월드 파운데이션 모델(World Foundation Model)이다. 2026년 1월 공개 이후 200만 건 이상 다운로드됐으며, 피규어 AI(Figure AI), 우버, 어질리티 로보틱스(Agility Robotics) 등이 활용 중이다. 월드모델 분야에서 엔비디아가 담당하는 역할은 “GPU가 LLM 시대에 했던 것”에 비유할 수 있다. 모델을 직접 개발하는 것이 아니라, 모든 플레이어가 의존하는 인프라를 공급한다.
로다 AI(Rhoda AI)
2026년 3월 18개월간의 스텔스를 마치고 공개된 로다 AI는 인터넷에 올라온 수억 개의 동영상으로 로봇 파운데이션 모델을 학습시키는 독특한 접근법으로 주목받았다. 프렘지 인베스트(Premji Invest) 주도의 시리즈A로 4억 5,000만 달러를 유치하며 기업가치 17억 달러를 인정받았다. DVA(Direct Video Action) 모델은 동영상에서 물리 법칙과 운동 패턴을 학습해, 로봇이 새로운 환경에서 단 10시간의 추가 데이터만으로 작업을 수행할 수 있게 한다. 실제 자동차 공장에서 50파운드짜리 컨테이너 해체 작업을 자율 수행하는 데 성공했으며, 제조·물류 분야의 산업 파트너들과 파일럿을 진행 중이다. 로봇 분야 더 자세한 내용은 로보틱스 랜드스케이프를 참고하길.
4. 응용 분야: 어디까지 쓰이나
월드모델의 응용은 로봇과 자율주행을 넘어 광범위하게 펼쳐지고 있다.
게임·VFX·콘텐츠 제작
기존 게임 엔진은 개발자가 모든 물리 법칙과 시나리오를 수동으로 코딩해야 했다. 월드모델은 이 과정을 뒤집는다. 런웨이 GWM Worlds, 월드랩스 마블, 디카트 Oasis가 각각 이 영역을 공략하고 있다. 영화 제작사는 복잡한 세트를 텍스트 몇 줄로 생성하고, 게임 개발사는 절차적으로 생성되는 무한한 세계를 만든다. 그간 헐리우드 스튜디오들이 런웨이와 파트너십을 맺은 것도 이 흐름의 일부다.
의료·과학 시뮬레이션
AMI 랩스와 나블라의 협업이 보여주듯, 월드모델의 신뢰도 향상은 의료 분야에서 특히 의미가 크다. LLM의 환각이 진단 오류로 이어지는 위험을 줄이고, 수술 시뮬레이션을 통해 실제 수술 전 반복 연습이 가능해진다. 엔비디아 코스모스는 이미 수술 로봇 훈련 데이터 생성에 활용 중이다. 신약 개발에서도 분자 상호작용을 시뮬레이션해 실험실 비용과 시간을 대폭 줄이는 연구가 진행 중이다.
건축·제조·디지털 트윈
오토데스크가 월드랩스에 2억 달러를 단독 투자한 것은 이 시장을 상징적으로 보여준다. 건축가는 설계 도면을 즉시 3D 공간으로 전환해 가상 걷기 체험을 하고, 제조업체는 공장 레이아웃 변경을 실제 시공 전에 시뮬레이션한다. 로다 AI의 산업 로봇이 자동차 공장에서 고변동 작업을 자율 처리하는 것도 같은 맥락이다.
자율주행 안전 검증
웨이브 GAIA-3와 엔비디아 알파마요가 보여주듯, 자율주행 시스템 검증에서 월드모델의 역할은 점점 커지고 있다. 실제 도로에서는 재현이 불가능하거나 위험한 상황들을 가상 환경에서 무한 반복 테스트할 수 있다. 미국에서 535,000마일당 1건 발생하는 충돌을 시뮬레이션으로 수천 번 재현해 AI를 강화할 수 있다.
월드모델과 LLM: 대체가 아닌 상호보완
월드모델이 LLM을 대체할 것이라는 관점은 지나치게 단순하다. 르쿤 자신도 “LLM은 계속 필요하다”고 인정한다. 미래는 두 기술의 협업으로 귀결될 가능성이 높다. LLM은 언어를 이해하고 설명하는 역할을, 월드모델은 공간을 이해하고 물리 세계에서 행동하는 역할을 나눠 맡는 구도다.
구글 딥마인드의 지니 3가 보여주듯, 두 기술은 이미 결합되고 있다. 텍스트 명령(LLM)으로 3D 세계(월드모델)를 생성하는 것이 그 예다. 엔비디아 알파마요도 언어 추론(VLM)과 물리 행동(월드모델)을 하나의 모델로 통합한다. AGI로 가는 길이 물리 세계와의 상호작용을 필요로 한다는 데 점점 많은 연구자들이 동의하는 가운데, 월드모델은 그 경로의 핵심 레이어로 자리 잡아가고 있다.
답글 남기기
댓글을 달기 위해서는 로그인해야합니다.