게임 데이터로 AI에게 세상 보는 법 가르친다… 오리진 랩, 800만 달러 시드


대형 언어모델(LLM)은 인터넷에 쌓인 방대한 텍스트를 먹고 자랐다. 하지만 ‘월드 모델(World Model)’은 다르다. 물리 법칙, 공간 구조, 사물의 움직임을 이해하려면 현실 세계가 어떻게 작동하는지를 담은 데이터가 필요하다. 문제는 그런 데이터가 인터넷에 깔려 있지 않다는 것이다. AI 연구소들이 월드 모델 훈련용 데이터를 구하지 못해 발을 동동 구르는 이유다.

Origin Lab Co Founders - 와우테일

오리진 랩(Origin Lab)은 이 공백을 비디오게임으로 채우겠다는 스타트업이다. 게임 안에는 물리 엔진, 3D 환경, 캐릭터 움직임, 조명 변화처럼 현실 세계의 작동 방식을 시뮬레이션한 데이터가 이미 수십 년치 쌓여 있다. 오리진 랩은 이 게임 데이터를 AI 훈련에 바로 쓸 수 있는 형태로 가공해, 데이터를 팔고 싶은 게임사와 사려는 AI 연구소를 잇는 마켓플레이스를 운영한다. 얀 르쿤(Yann LeCun)의 AMI 랩스(AMI Labs), 페이페이 리(Fei-Fei Li)의 월드 랩스(World Labs) 같은 곳이 잠재 고객이다.

라이트스피드 벤처 파트너스(Lightspeed Venture Partners)가 주도하고 SV 엔젤(SV Angel), 에니악(Eniac), 세븐 스타스(Seven Stars), FPV가 참여한 시드 라운드로 800만 달러를 조달했다. 트위치(Twitch) 공동 창업자 케빈 린(Kevin Lin)과 크루즈(Cruise) 창업자 카일 보트(Kyle Vogt)도 엔젤 투자자로 이름을 올렸다.

게임 업계 베테랑 3인이 뭉쳤다

공동 CEO 콜린 캐리어(Colin Carrier)는 2017년 트위치에서 컴퓨터 비전·머신러닝 팀 인수를 이끌며 AI 데이터 파이프라인을 처음 접했다. 이후 공동 창업한 피냐타 팜스(Pinata Farms)에서 직접 데이터 레이블링 파이프라인을 구축하고 자체 모델을 훈련시키며 훈련 데이터의 품질이 모델 성능을 좌우한다는 것을 몸소 체득했다.

공동 CEO 안-마르고 로드(Anne-Margot Rodde)는 게임 업계에서 10년 이상을 보낸 인물이다. 에픽게임즈(Epic Games)의 포트나이트 크리에이터 플랫폼 UEFN을 중심으로 크리에이터 스튜디오 크리에이터즈 코프(Creators Corp.)를 창업해 실제 게임사와의 파트너십 네트워크를 쌓아왔다. CTO 앙투안 가르고(Antoine Gargot)는 10년 이상 데이터·ML·AI 엔지니어링을 해온 인물로, 오리진 랩의 데이터 가공 파이프라인을 책임진다.

게임 데이터를 둘러싼 경쟁

오리진 랩이 이 시장에 혼자 뛰어든 건 아니다. 게임 클립 공유 플랫폼 메달(Medal)을 모체로 한 제너럴 인튜이션(General Intuition)은 연간 20억 건의 게임 영상을 보유한 데이터 모아로 월드 모델 훈련 시장을 공략 중이다. 클로슬라 벤처스·제너럴 카탈리스트 주도로 1억 3,400만 달러 시드를 조달했으며, 오픈AI(OpenAI)가 5억 달러에 메달 인수를 시도했다가 무산된 것이 알려지면서 주목받기도 했다. 오디세이(Odyssey)는 360도 카메라로 실세계를 직접 촬영해 월드 모델 훈련 데이터를 만드는 접근법을 택했다. 2,700만 달러를 조달했다.

오리진 랩이 차별화를 꾀하는 지점은 ‘저작권 해결’이다. 게임 데이터를 AI 훈련에 쓰려면 저작권과 라이선스 문제를 반드시 해결해야 하는데, 오리진 랩은 게임사와 직접 계약을 맺어 권리 관계가 깔끔하게 정리된 데이터만 공급한다. 라이트스피드의 파라즈 파테미(Faraz Fatemi) 파트너는 “스케일AI(Scale.AI)의 성공이 이 기회를 외면할 수 없게 만들었다”며 “주요 AI 연구소에 데이터를 공급하는 업체들이 얼마나 빠르게 매출을 끌어올릴 수 있는지 증명됐다”고 말했다.

월드 모델 분야에 대한 자세한 내용은 여기를 참고하시길.

기사 공유하기

답글 남기기