AI 음성 모델 훈련 ‘데이비드AI’, 5000만 달러 시리즈B 투자 유치


데이비드AI(David AI)가 메리테크(Meritech), 엔비디아(NVIDIA)로부터 5000만 달러(약 675억원) 규모의 시리즈B 투자를 유치했다고 8일 발표했다. 기존 투자자인 알트 캐피털(Alt Capital), 퍼스트 라운드 캐피털(First Round Capital), 앰플리파이 파트너스(Amplify Partners), 와이콤비네이터(Y Combinator)도 후속 투자에 참여했다. 이번 투자로 데이비드AI의 기업가치는 5억 달러(약 6750억원)에 달하며, 지난 5월 시리즈A 당시 평가액 1억 달러의 5배 수준으로 상승했다.

david ai team - 와우테일

데이비드AI는 AI 모델 훈련을 위한 고품질 오디오 데이터셋을 제공하는 스타트업이다. 2024년 초 스케일AI(Scale AI) 출신 토머 코헨(Tomer Cohen)과 벤 와일리(Ben Wiley)가 공동 창업했으며, 창립 1년 만에 연매출 1000만 달러를 돌파하며 빠른 성장세를 보이고 있다. 현재 빅테크 7개사(Mag 7) 중 다수와 주요 AI 연구소 대부분을 고객으로 확보했다.

오디오AI는 실제 세상에서 AI를 구현하는 핵심 인터페이스로 주목받고 있다. 음성 인식 고객 서비스부터 휴머노이드 로봇, 웨어러블 기기, 개인 비서, 생성형 미디어까지 다양한 분야에서 음성 기반 AI의 수요가 급증하고 있다. 하지만 현재 AI 모델들이 필요로 하는 오디오 데이터의 양과 품질은 기존에 이용 가능한 수준을 훨씬 초과한다는 게 업계의 평가다.

메타AI가 2024년 발표한 논문에 따르면, 차세대 음성 모델 개발을 위해서는 수백만 시간 분량의 채널 분리형 자연스러운 대화 데이터가 필요하다. 그러나 현재 공개적으로 접근 가능한 모든 데이터셋을 합쳐도 단 3000시간에 불과한 실정이다. 텍스트 기반 챗봇 데이터와 달리 음성 대화 데이터는 극도로 제한적이며, 고품질 오디오 데이터는 단편적으로 흩어져 있어 ‘오디오판 커먼크롤(Common Crawl)’이라 할 만한 통합 자료가 존재하지 않는다.

데이비드AI는 이러한 데이터 부족 문제를 해결하기 위해 오디오 데이터 연구 전문 기업으로 포지셔닝했다. 단순히 데이터를 수집하는 것을 넘어, 모델 개발에 적용하는 것과 동일한 수준의 연구 기반 엄격함을 데이터셋 구축에 적용한다. 어떤 데이터셋을 수집할지 결정하고, 해당 데이터셋을 평가하고 반복 개선하며, 단순히 ‘데이터 품질’만이 아니라 모델 훈련에서의 실질적 효과까지 고려한다.

데이비드AI의 주력 제품은 여러 종류의 전문 오디오 데이터셋이다. 대표 제품인 ‘컨버스(Converse)’는 1만5000시간 분량의 채널 분리형 자연스러운 2인 대화 데이터로, 다양한 주제를 망라한다. ‘아틀라스(Atlas)’는 15개 이상 언어를 지원하는 다국어 데이터셋으로 방언과 억양에 대한 상세한 메타데이터를 포함한다. ‘코러스(Chorus)’는 3인 이상이 참여하는 대화 데이터셋으로 화자 분리 및 다이어리제이션 모델 훈련용으로 설계됐다. ‘다이얼로그(Dialog)’는 여러 전문 분야의 전문가 대화를 수집한 데이터셋이다.

데이비드AI의 차별화 포인트는 스튜디오급 음질을 대규모로 확보하는 능력이다. 모든 언어와 지역을 아우르며 음질의 미묘한 차이를 보존하는 전용 소프트웨어, 하드웨어, 운영 시스템을 구축했다. 창립 이후 시장에서 가장 큰 규모의 채널 분리형 음성 데이터 코퍼스를 수집했으며, 이는 기존 최대 데이터셋의 10배에 달한다. 15개 이상 언어에 걸쳐 풍부한 억양과 방언 메타데이터를 포함하고 있으며, 이 데이터는 이미 시장 최고 수준의 여러 음성 모델 훈련에 활용됐다.

코헨과 와일리 공동 창업자는 스케일AI에서 근무하며 AI 데이터 인프라의 중요성을 체감했다. 코헨은 스케일AI에서 사업부를 구축했고, 와일리는 스케일AI의 공공 부문 생성AI 플랫폼과 마이크로소프트의 엔터프라이즈 클라우드에서 엔지니어링을 담당했다. 두 사람은 고품질 오디오 데이터에 대한 시장의 근본적 수요를 발견하고 이를 해결하기 위해 데이비드AI를 설립했다.

데이비드AI는 지난 1년간 3차례 투자 유치에 성공했다. 2025년 1월 퍼스트 라운드 캐피털 주도로 500만 달러 시드 투자를 유치했고, 5월에는 알트 캐피털과 앰플리파이 파트너스 공동 주도로 2500만 달러 시리즈A 투자를 받았다. 이번 시리즈B까지 누적 투자액은 8000만 달러를 넘어섰다. 시리즈A 투자 당시 알트 캐피털의 잭 앨트먼(Jack Altman)이 이사회에 합류했으며, 박스그룹(BoxGroup), SV앤젤(SV Angel), 리퀴드2(Liquid 2) 등도 초기 단계부터 투자에 참여했다.

david ai logo - 와우테일

데이비드AI는 현재 샌프란시스코에 본사를 두고 있으며 11~50명 규모의 팀을 운영 중이다. 이번 투자를 통해 연구, 제품, 엔지니어링, 운영 부문에 걸쳐 팀을 확대할 계획이다. 회사는 성장 점수 73점, 열기 점수 74점을 기록하며 투자자들의 높은 관심을 받고 있다.

엔비디아의 이번 투자 참여는 특히 주목할 만하다. AI 인프라의 핵심 기업인 엔비디아가 오디오 데이터 전문 스타트업에 투자한 것은 음성 기반 AI의 미래 가치를 인정한 것으로 해석된다. 엔비디아는 최근 AI 슈퍼컴퓨팅, 물리적AI, 양자컴퓨팅 등 차세대 AI 인프라에 적극 투자하고 있으며, 데이비드AI는 이러한 비전의 핵심 파트너로 자리매김했다.

데이비드AI는 공식 발표를 통해 “오디오AI가 AI를 실제 세상으로 가져와 수십억 명의 사람들이 접근할 수 있게 만드는 놀라운 기회를 갖고 있다”며 “미래의 오디오 인터페이스는 현재 이용 가능한 것보다 기하급수적으로 많은 데이터와 평가를 필요로 하며, 데이비드AI는 이러한 데이터를 만들어내기 위해 존재한다”고 밝혔다. 회사는 “우리가 일을 잘 해낸다면 오디오AI가 확산되고, 휴머노이드 로봇, 웨어러블, 개인 비서, 생성형 미디어 같은 실제 세상의 활용 사례들이 실현될 것”이라고 강조했다.

업계 전문가들은 데이비드AI가 음성AI 분야의 ‘ChatGPT 모멘트’를 앞당기는 핵심 기업이 될 것으로 전망한다. 2025년은 오디오AI가 본격적으로 주목받는 원년이 될 것이며, 고품질 데이터 제공 기업이 생태계의 중심에 설 것이라는 분석이다. 데이비드AI의 이번 대규모 투자 유치는 AI 산업에서 데이터 인프라의 중요성이 더욱 커지고 있음을 보여주는 사례로 평가받고 있다.

기사 공유하기

답글 남기기