AI 추론 인프라 스타트업 ‘모달랩스’, 25억 달러 가치에 신규 투자 유치 논의 중


AI 추론 인프라 스타트업 모달랩스(Modal Labs)가 25억 달러 밸류에이션으로 신규 투자 라운드를 논의하고 있다는 소식이 전해졌다. 이번 거래가 성사되면 불과 5개월 전 11억 달러였던 밸류가 2배 이상 뛰는 셈이다.

ModalLabs logo - 와우테일

제너럴카탈리스트(General Catalyst)가 이번 라운드를 리드할 것으로 알려졌다. 거래 내막을 아는 4명의 소식통에 따르면 모달랩스의 연간 반복 매출(ARR)은 약 5000만 달러다. 다만 협상이 아직 초기 단계라 최종 조건은 달라질 수 있다.

모달랩스의 에릭 번하르손(Erik Bernhardsson) 공동창업자 겸 CEO는 회사가 적극적으로 투자를 유치하고 있다는 사실을 부인했다. 최근 벤처캐피털리스트들과 나눈 대화는 일반적인 논의 수준이었다는 설명이다. 제너럴카탈리스트는 논평 요청에 답하지 않았다.

모달랩스는 2021년 설립됐다. 지난해 10월 럭스캐피털(Lux Capital)이 리드한 8700만 달러 시리즈 B를 유치하며 11억 달러 밸류를 달성했다. 당시까지 총 누적 투자금은 1억 1100만 달러였다. 초기 투자자로는 럭스캐피털과 레드포인트벤처스(Redpoint Ventures)가 참여했다.

번하르손 CEO는 스포티파이(Spotify)와 베터닷컴(Better.com)에서 15년 넘게 데이터 팀을 만들고 이끈 인물이다. 스포티파이에서는 음악 추천 시스템을 개발했고, 베터닷컴에서는 CTO를 지냈다.

AI 추론 시장에 몰리는 투자 열풍

모달랩스는 지금 투자자들이 가장 주목하는 소수의 추론 중심 기업 중 하나다. AI 산업의 초점이 모델 학습(training)에서 추론(inference)으로 빠르게 이동하고 있기 때문이다.

추론은 학습된 AI 모델을 실제 서비스에 배포해 사용자 요청에 답을 내놓는 과정이다. 추론 효율을 높이면 컴퓨팅 비용을 크게 줄이고, 사용자가 질문을 던지고 AI가 답하기까지 걸리는 시간도 단축할 수 있다. 업계 분석가들은 2023년 전체 AI 컴퓨팅의 3분의 1을 차지했던 추론이 2026년 말에는 3분의 2를 차지할 거라고 본다.

지난주 모달랩스의 경쟁사 베이스텐(Baseten)은 3억 달러를 투자받으며 50억 달러 밸류를 달성했다. 몇 달 전인 지난해 9월 21억 달러였던 밸류가 2배 넘게 뛴 것이다. 베이스텐 라운드는 IVP, 캐피털G(CapitalG), 엔비디아(NVIDIA)가 앵커 투자자로 참여했다.

추론 클라우드 제공업체 파이어웍스AI(Fireworks AI)도 지난 10월 2억 5000만 달러를 유치하며 40억 달러 밸류를 기록했다. 파이토치(PyTorch) 팀 출신들이 창업한 파이어웍스AI는 라이트스피드벤처파트너스(Lightspeed Venture Partners), 인덱스벤처스(Index Ventures), 에반틱(Evantic)이 공동 리드한 시리즈 C로 총 3억 2700만 달러를 모았다.

1월에는 오픈소스 추론 프로젝트 vLLM의 창시자들이 이를 벤처 지원 스타트업 인퍼랙트(Inferact)로 전환하며 앤드리슨호로위츠(Andreessen Horowitz)가 리드한 1억 5000만 달러 시드 투자를 유치해 8억 달러 밸류를 달성했다. SGLang 팀이 만든 래딕스아크(RadixArk)는 액셀(Accel)이 리드한 시드 투자로 4억 달러 밸류를 확보한 것으로 전해졌다.

모달랩스의 기술과 시장 포지션

모달랩스는 AI 추론을 위한 서버리스 클라우드 인프라를 제공한다. 개발자들은 복잡한 설정이나 용량 걱정 없이 전 세계에 흩어진 GPU와 CPU를 활용할 수 있다. 머신러닝 추론, 미세 조정, 배치 작업 같은 컴퓨팅 집약적인 작업을 쉽게 돌릴 수 있도록 만든 플랫폼이다.

모달랩스는 기존 클라우드 업체들이 재활용하는 시스템과 다르다. 자체 인프라 스택을 처음부터 새로 짰다. 커스텀 파일 시스템, 컨테이너 런타임, 스케줄러, 이미지 빌더 등 AI 워크로드의 규모와 예측 불가능성을 감당하도록 설계한 구성 요소들이다. 1초도 안 되는 시간에 워크로드를 시작할 수 있다.

샌드박스 환경, 배치 프로세싱, 통합 노트북 같은 개발자 도구도 제공한다. 샌드박스에서는 새로운 모델과 에이전트를 안전하게 테스트할 수 있고, 배치 프로세싱은 음성 전사, 단백질 접힘, 날씨 시뮬레이션 같은 대규모 작업을 지원한다.

추론 인프라가 AI의 미래를 결정한다

AI 추론 인프라에 쏟아지는 투자는 AI 산업의 근본적인 변화를 보여준다. 지난 몇 년간 거대 모델 학습에만 집중했다면, 이제는 학습된 모델을 실시간으로 효율적으로 돌리는 추론 단계로 무게중심이 옮겨갔다.

효율적인 추론 레이어는 강력한 AI 모델과 실용적이고 확장 가능한 애플리케이션을 잇는 필수 다리다. 이게 없으면 생성형 AI의 약속은 감당할 수 없는 비용과 형편없는 성능 때문에 무너질 수 있다.

모달랩스 같은 추론 스타트업들은 모델 서빙, 양자화, 하드웨어 최적화를 위한 독자 기술을 개발하도록 동기부여를 받는다. 이런 경쟁은 결국 비용을 낮추고 모든 개발자를 위한 도구를 개선한다. 고객 지원 챗봇부터 복잡한 데이터 분석 도구까지, 다양한 제품과 서비스에 AI를 빠르게 접목할 수 있게 된다.

몇 개 안 되는 대형 파운데이션 모델에 의존하던 것에서 벗어나, 수천 개의 전문화된 도메인별 모델로 향하는 생태계의 변화도 눈에 띈다. 각 모델은 특정 작업에 최적화되고, 기업들은 자기 IP를 소유하면서 인프라도 직접 통제할 수 있다.

기사 공유하기

답글 남기기