딥인프라, 1억700만 달러 유치… 엔비디아·삼성넥스트 참여한 추론 인프라 클라우드


AI 추론(inference) 시장의 경쟁이 뜨거워지고 있다. 오픈AI(OpenAI)나 앤트로픽(Anthropic) 같은 대형 AI 기업들은 독자 API를 앞세우고, 아마존(Amazon)·구글(Google)·마이크로소프트(Microsoft) 같은 클라우드 공룡들은 자사 인프라 위에 AI 추론 서비스를 올리려 한다. 하지만 양쪽 어디에도 속하지 않은 독립 추론 클라우드들이 조용히 성장하고 있다. 그 중심에는 자체 GPU 인프라를 직접 소유·운영하며 개발자들에게 저렴한 오픈소스 모델 API를 공급하는 딥인프라(DeepInfra)가 있다.

deepinfra - 와우테일

딥인프라가 시리즈B 라운드로 1억700만 달러를 유치했다. 이번 라운드는 500 글로벌(500 Global)과 조르주 하릭(Georges Harik)이 공동 주도했고, 엔비디아(NVIDIA)·삼성넥스트(Samsung Next)·수퍼마이크로(Supermicro)·A.Capital 벤처스·크레센트 코브(Crescent Cove)·펠리시스(Felicis)·피크식스(Peak6)·어퍼90(Upper90)이 참여했다. 딥인프라는 2022년 창업 이후 처음 시드 라운드부터 시리즈A까지 성장해왔으며, 이번 시리즈B는 글로벌 컴퓨팅 용량 확장과 개발자 도구 고도화에 쓸 계획이다.

메신저 인프라를 AI 추론으로

딥인프라의 공동창업자 세 명—니콜라 보리소프(Nikola Borisov) CEO, 예센 카나핀(Yessen Kanapin), 조르지오스 파푸치스(Georgios Papoutsis)—은 모두 메신저 앱이모(imo)의 백엔드 인프라를 함께 구축한 엔지니어 출신이다. 이모는 월간 활성 사용자 2억 명, 누적 플레이스토어 다운로드 10억 건을 기록한 글로벌 메신저다. 팀은 이모를 운영하며 한 가지 결론에 도달했다. 클라우드를 빌리는 것보다 하드웨어를 직접 사는 게 훨씬 싸다는 것이다.

이 경험을 그대로 AI 추론에 적용했다. 코어위브나 람다 같은 GPU 클라우드가 컴퓨팅 자원을 임대하는 데 집중한다면, 딥인프라는 거기서 한 단계 더 올라간다. 미국 내 8개 데이터센터에 GPU를 직접 소유·운영하면서, 라마(Llama)·딥시크(DeepSeek)·미스트랄(Mistral) 등 190개 이상의 오픈소스 모델을 OpenAI 호환 API로 묶어 제공하는 수직통합 구조다. 개발자는 코드 수정 없이 엔드포인트 하나만 바꾸면 오픈AI 대비 5~10배 저렴하게 쓸 수 있다. GLM-5 기준 딥인프라의 100만 토큰당 가격은 1.24달러로, 시장 평균보다 약 20% 싸다.

시리즈A 이후 25배 성장

딥인프라의 성장 속도는 가파르다. 시리즈A 이후 처리 토큰 양이 25배 증가했다. 현재 주당 처리하는 토큰은 거의 5조 개에 달한다. 에이전트 기반 AI 시스템의 확산이 이 성장을 견인하고 있다. 하나의 에이전트 작업이 모델 호출을 50~100번 이상 요구하는 경우가 흔해지면서, 추론 인프라의 비용과 안정성이 AI 서비스 전체의 수익성을 좌우하는 결정 변수가 됐다.

엔비디아와의 협력도 차별화 포인트다. 딥인프라는 엔비디아 오픈 AI 생태계의 초기 인프라 파트너로, 네모트론(Nemotron) 모델·네모클로(NemoClaw) 에이전트 프레임워크·다이나모(Dynamo) 추론 소프트웨어를 지원하고 있다. 블랙웰(Blackwell) GPU의 조기 도입과 곧 출시될 베라 루빈(Vera Rubin)까지 탑재하면 추론 비용 효율성이 최대 20배까지 개선될 것으로 기대하고 있다.

보안 측면에서도 제로 데이터 리텐션, SOC 2·ISO 27001 인증을 갖추며 기업 고객 요구 사항을 충족했다.

추론이 AI의 새 전쟁터

이번 투자 라운드를 공동 주도한 조르주 하릭은 구글 초기 멤버이자 이모의 공동창업자로, 딥인프라의 어드바이저이기도 하다. 그는 AI 스타트업 휴먼스&(Humans&)의 공동창업자이기도 하며, 이번 딥인프라 시리즈B에 투자자로도 다시 이름을 올렸다.

엔비디아의 참여는 단순한 재무적 투자 이상의 의미를 가진다. 엔비디아는 이미 코어위브(CoreWeave), 람다(Lambda), 베이스텐(Baseten), 앤트로픽에 이르기까지 AI 인프라 생태계 전반에 직접 투자하며 영향력을 확장하고 있다. 딥인프라의 성장은 곧 엔비디아 블랙웰 GPU의 추가 조달로 이어지는 구조다.

AI 추론 시장의 경쟁 구도에 대한 자세한 내용은 AI 추론(Inference) 지형도 2026을 참고하시길.주요 AI 기업들의 투자 관계망에 대한 자세한 내용은 여기를 참고하시길.

기사 공유하기

답글 남기기