보컬 이미지, 360만 달러 시드 투자 유치…AI 음성 코칭으로 글로벌 시장 공략


에스토니아 탈린에 본사를 둔 스타트업 보컬 이미지(Vocal Image)가 최근 360만 달러(약 50억 원) 규모의 시드 투자를 유치했다. 이번 라운드는 프랑스 에듀테크 전문 벤처캐피털 에듀캐피털(Educapital)이 주도했으며, 에스토니아의 스페셜리스트 VC(Specialist VC)와 독일의 제너레이션 펀드(Generations Fund)가 참여했다.

Vocal Image at AI Startup Program launch event by Vanessa Buhrig - 와우테일

보컬 이미지는 언어를 새로 학습하는 서비스가 아니라, AI 기반 음성 코칭을 통해 발성, 억양, 자신감 등 말하기 능력을 향상시키는 데 초점을 맞추고 있다. 앱에는 혀 꼬기, 호흡 훈련, 제스처 조언 등 다양한 콘텐츠가 포함돼 있으며, AI가 실시간으로 발음을 분석하고 개선 포인트를 제시한다. 사용자는 집에서 혼자 연습하더라도 마치 전문 코치에게 피드백을 받는 듯한 경험을 할 수 있다.

회사의 시작은 공동창업자 닉 라호이카(Nick Lahoika) CEO의 개인적인 경험에서 비롯됐다. 벨라루스에서 태어난 그는 영어를 뒤늦게 배웠고, 말하기 불안과 발음 문제로 어려움을 겪었다. 이후 보컬 코치를 만나 목소리와 소통 능력이 훈련을 통해 향상될 수 있다는 사실을 깨닫고, 이를 더 많은 사람들이 활용할 수 있도록 유튜브 채널을 시작했다. 이 채널이 발전해 지금의 앱 서비스로 이어졌다.

기술적인 강점 역시 눈에 띈다. 보컬 이미지는 하루 평균 3만5천 건 이상의 음성 데이터를 수집하며, 지금까지 100만 건 이상의 실제 음성 샘플을 확보했다. 이 데이터는 단순 축적에 그치지 않고, 사용자 커뮤니티가 직접 참여해 발음이 ‘자신감 있게 들리는지(confident)’ 혹은 ‘유아스럽게 들리는지(childlike)’를 평가하는 방식으로 라벨링된다. 이렇게 정교하게 분류된 데이터셋은 개인 맞춤형 코칭의 정확도를 높이고, 장기적으로는 합성 음성 개발 및 Conversational AI 고도화에도 활용될 수 있는 자산이 된다.

사업 성장세도 가파르다. 프리시드 단계에서 100만 달러 미만의 투자로 연간 반복 매출(ARR) 650만 달러를 달성한 보컬 이미지는, 현재 ARR 1,200만 달러와 5만 명 이상의 유료 사용자를 확보했다. 20명 규모의 팀은 다수의 벨라루스 출신 창업자와 개발자들로 구성돼 있으며, 이번 투자를 통해 개발 인력을 확충하고 다국어 현지화 범위를 넓힐 계획이다. 현재 영어, 스페인어, 독일어, 프랑스어, 우크라이나어, 러시아어를 지원하고 있으며, 앞으로 추가 언어를 준비 중이다.

보컬 이미지는 이미 Hugging Face·Meta·Scaleway가 주관한 유럽 AI 스타트업 프로그램에서 수상하며 기술력을 인정받았다. GDPR을 준수하는 데이터 운영, 빠른 매출 성장, 그리고 틈새시장인 ‘AI 음성 코칭’이라는 명확한 포지셔닝을 무기로 글로벌 시장에서 영향력을 확대하고 있다. 경쟁사들이 AI 기반 스피치 트레이너 기능을 잇달아 도입하는 상황에서도, 자체 구축한 대규모 실사용 데이터셋을 기반으로 차별화된 경쟁력을 유지하고 있다는 평가다.

기사 공유하기

답글 남기기