AI 데이터 플랫폼 ‘프로테제’, 3천만 달러 추가 투자 유치


AI 학습 데이터 접근성을 확대하는 프로테제(Protege)안드레센 호로위츠(Andreessen Horowitz, a16z) 주도로 3천만 달러 규모의 시리즈 A 추가 투자를 유치했다 밝혔다. 지난해 8월 2,500만 달러 시리즈 A 라운드에 이은 후속 투자로, 누적 투자 유치액은 6,500만 달러가 됐다. 풋워크(Footwork), CRV, 블룸버그 베타(Bloomberg Beta), 플렉스 캐피탈(Flex Capital), 셰이퍼 캐피탈(Shaper Capital) 등 기존 투자자들이 모두 참여했다.

Protege logo - 와우테일

프로테제는 AI 개발사와 데이터 제공자를 연결하는 플랫폼이다. 의료 기록과 영상부터 미디어 콘텐츠, 오디오까지 다양한 분야의 실제 데이터를 라이선스 계약으로 확보해 AI 학습에 맞게 가공한다. 현재 수백 개 기관과 파트너십을 맺고 있으며, 빅테크 7개 기업 중 대다수가 고객사로 알려졌다.

바비 사무엘스(Bobby Samuels) CEO는 “모든 산업에서 실제 데이터 수요가 공급을 앞지르고 있다”며 “데이터는 극도로 분산돼 있고, 보유자와 개발사 모두 이를 대규모로 활용할 준비가 안 돼 있다”고 했다. 프로테제는 큐레이션된 데이터를 제공하면서 데이터 제공자에게는 새로운 수익원을 열어준다는 설명이다.

공동 창업자이자 회장인 트래비스 메이(Travis May)는 데이터 연결 분야의 베테랑이다. 라이브램프(LiveRamp)와 데이터번트(Datavant)를 각각 창업하고 CEO를 지냈다. 그는 “데이터 접근이 AI 발전의 가장 큰 병목”이라며 “다음 단계 AI는 일상에서 생성되는 독점 데이터가 이끌 것”이라고 내다봤다. 프로테제는 이런 데이터에 안전하게 접근하고 소유자에게 보상하는 모델을 만들고 있다.

프로테제가 보유한 데이터 규모는 상당하다. 비디오 콘텐츠 30만 시간 이상, 오디오 50만 시간 이상, 임상 기록 수십억 건, 의료 영상 수억 장에 접근할 수 있다. 지난해 12월에는 캘리오피 네트워크(Calliope Networks) 인수로 프리미엄 영상 데이터 영역까지 확장했다. 2025년 한 해 동안 파트너 네트워크를 수백 개 조직으로 늘렸다.

비즈니스 모델도 흥미롭다. 파트너 네트워크에서 데이터세트를 큐레이션해 AI 개발 요구에 맞추고, 데이터가 사용될 때마다 파트너에게 수익을 분배한다. 데이터 제공자는 활용되지 않던 자산을 수익원으로 바꾸고, AI 개발사는 고품질 학습 데이터를 확보하는 셈이다.

a16z의 데이지 울프(Daisy Wolf) 파트너는 “다음 AI 시대는 세계에서 가장 가치 있는 데이터를 책임감 있게 개방하는 기업이 만들 것”이라며 “프로테제는 여러 산업의 복잡한 데이터를 존중하면서도 AI 개발에 바로 쓸 수 있게 만든다”고 평가했다.

AI 학습 데이터 시장은 뜨겁다. 스케일 AI(Scale AI)는 지난해 6월 메타로부터 143억 달러 투자를 받으며 290억 달러 밸류에이션을 인정받았다. 다만 이 거래 이후 오픈AI와 구글이 스케일과 거리를 두면서 중립적인 데이터 파트너를 찾는 움직임이 활발해졌다. 레이블박스(Labelbox)는 1억 8,900만 달러를, 스노클 AI(Snorkel AI)는 10억 달러 밸류에이션으로 1억 달러를 유치한 바 있다.

프로테제는 경쟁사와 접근법이 다르다. 스케일이나 레이블박스가 데이터 레이블링과 어노테이션 플랫폼에 집중한다면, 프로테제는 데이터 소싱과 라이선싱이 강점이다. 접근하기 어려운 독점 데이터 권한을 확보하고 AI 학습에 최적화해 제공하는 게 핵심이다.

이번 투자금은 제품 개발 속도를 높이고, 새로운 데이터 분야로 확장하며, 주요 기관과의 파트너십을 강화하는 데 쓰인다. 실제 데이터에 대한 권리가 보호되는 AI용 데이터 접근 서비스를 제공할 팀과 인프라 구축에도 투입될 예정이다.

기사 공유하기

답글 남기기