데이터허브, AI 시대 ‘데이터 컨텍스트 관리’ 플랫폼으로 3500만 달러 투자 유치


오픈소스 메타데이터 플랫폼 선두기업인 데이터허브(DataHub)가 베세머 벤처 파트너스(Bessemer Venture Partners) 주도로 3,500만 달러) 규모의 시리즈 B 투자를 유치했다고 발표했다. 이번 투자로 데이터허브의 총 투자 유치 금액은 6,500만 달러에 달한다.

DataHub Website Feature Thumb 1200x628 - 와우테일

AI 시대, 데이터 ‘컨텍스트’가 핵심

기업들이 AI를 본격적으로 도입하면서 새로운 문제가 떠오르고 있다. 바로 데이터와 AI 모델, AI 에이전트 전반에 걸친 ‘컨텍스트(맥락) 관리’다.

예를 들어보자. 한 대형 이커머스 회사에서 고객 추천 AI 시스템을 운영한다고 가정해보자. 이 AI 시스템이 제대로 작동하려면 단순히 상품 데이터만 있으면 되는 것이 아니다. 어떤 데이터가 언제 업데이트됐는지, 어떤 데이터가 신뢰할 만한지, 개인정보가 포함된 민감한 데이터는 무엇인지, 데이터 간의 연관관계는 어떻게 되는지 등 데이터를 둘러싼 모든 ‘맥락’을 AI가 이해해야 한다.

하지만 현실은 다르다. 데이터 소비자들은 필요한 데이터셋을 쉽게 찾지 못하고, 데이터 엔지니어들은 변경사항이 시스템에 미칠 영향을 예측하기 어렵다. 거버넌스 팀은 민감한 데이터에 대한 접근을 추적하는 데 애를 먹는다. AI 시스템의 경우 이런 ‘컨텍스트 부족’ 문제는 더욱 심각하다.

실시간 메타데이터로 해결책 제시

데이터허브는 이런 문제를 실시간 메타데이터 플랫폼으로 해결한다. 스와룹 자가디시(Swaroop Jagadish) 데이터허브 CEO는 “기업의 AI 도입이 가속화되면서 데이터와 AI 생태계 전반에 걸친 포괄적인 가시성, 신뢰성, 신뢰가 중요해지고 있다”며 “전통적인 데이터 카탈로깅을 넘어 AI 에이전트가 데이터의 핵심 사용자가 되는 머신 스케일 세상에 대비해야 한다”고 말했다.

구체적인 활용 사례를 살펴보면, 넷플릭스 같은 스트리밍 서비스에서 콘텐츠 추천 알고리즘을 운영할 때 데이터허브를 활용할 수 있다. 시청자의 시청 패턴 데이터, 콘텐츠 메타데이터, 평점 데이터 등이 실시간으로 업데이트될 때마다 AI 시스템이 자동으로 이를 인지하고 추천 모델을 업데이트할 수 있다. 동시에 개인정보보호 규정에 따라 어떤 데이터에 접근 제한이 있는지도 자동으로 관리된다.

글로벌 기업들의 선택

데이터허브의 오픈소스 버전은 이미 애플, 차임(Chime), 포스퀘어(Foursquare), 넷플릭스, 옵텀(Optum), 핀터레스트, 슬랙 등 3,000개 이상의 글로벌 기업에서 사용되고 있다. 특히 기업용 관리 서비스인 ‘데이터허브 클라우드’는 지난 2년간 6배 성장을 기록했다.

데이터허브의 경쟁력은 이벤트 기반 아키텍처에 있다. 기존 레거시 업체들과 달리 실시간 가시성을 제공하며, 단일 노드부터 클라우드 호스팅, 하이브리드, 분산 배포까지 다양한 배포 옵션을 지원한다. 이를 통해 기존 업체들과의 경쟁에서 우위를 점하고 있다.

투자 배경과 향후 계획

베세머 벤처 파트너스의 로리 무어(Lauri Moore) 파트너는 “메타데이터는 조직이 인간 중심의 데이터 분석에서 머신 스케일의 기업 AI로 전환하는 데 필요한 연결고리”라며 “데이터허브는 스키마 우선, 이벤트 지향 아키텍처로 데이터와 모델 컨텍스트를 통합 관리할 수 있는 독특한 위치에 있다”고 투자 이유를 설명했다.

이번 투자를 계기로 회사는 ‘아크릴 데이터’에서 ‘데이터허브’로 브랜드를 변경한다. 조달한 자금은 △1만 3,000명으로 50배 성장한 오픈소스 커뮤니티 투자 △AI 거버넌스와 컨텍스트 관리 기능 중심의 R&D 가속화 △증가하는 기업 수요에 대응한 영업 조직 확대 △엔터프라이즈급 고객 성공 역량 구축에 사용될 예정이다.

AI가 기업 운영의 핵심이 되어가는 지금, 데이터의 ‘맥락’을 제대로 관리하는 것이 AI 성공의 열쇠가 될 것으로 보인다. 데이터허브는 이런 시장 변화의 중심에서 차세대 데이터 인프라를 구축해 나가고 있다.

기사 공유하기

답글 남기기