팔라브라 AI, 실시간 음성 번역 솔루션으로 840만 달러 투자유치


AI 기반 음성 번역 엔진을 개발하는 스타트업 팔라브라 AI(Palabra AI)가 대규모 언어 모델(LLM)의 난제로 꼽히는 실시간 음성 번역 분야에서 혁신을 일으키고 있다. 최근 팔라브라는 벤처캐피털 세븐 세븐 식스(Seven Seven Six)를 주축으로 한 투자 라운드에서 840만 달러(약 115억 원)의 프리시드 투자를 유치하며 기술력과 성장 잠재력을 인정받았다.

Palabra AI logo - 와우테일

레딧 공동 창업자이자 세븐 세븐 식스의 설립자인 알렉시스 오하니안은 AI가 텍스트 번역은 쉽게 해내지만, 음성 번역은 실시간 언어 전환과 인간적인 목소리 구현이라는 복합적인 문제 때문에 훨씬 어렵다고 지적했다. 그는 팔라브라가 이 문제에 대한 해답을 제시했다고 판단해 투자를 결정했다. 

오하니안은 팔라브라의 번역 기술이 매끄럽게 작동하고, 뛰어난 AI 연구팀의 역량과 제품의 완성도가 높다는 점을 높이 평가했다. 이번 투자에는 크리에이터 벤처스를 비롯해 인스타카트 공동 창업자 맥스 멀렌 등 저명한 개인 투자자들도 참여했다.

2023년 아르템 쿠카렌코와 알렉산더 카바코프가 공동 창업한 팔라브라는 기존 음성 번역 솔루션의 한계를 극복하는 데 주력했다. 기존 솔루션들은 음성-텍스트 변환과 텍스트-음성 변환 API를 따로 사용해 번역 지연 시간이 길어지는 문제가 있었다. 팔라브라는 독자적인 기술을 통해 이 지연 시간을 800ms까지 단축하며 실시간에 가까운 매끄러운 번역을 구현했다. 또한, 새로운 언어를 몇 주 안에 추가할 수 있는 맞춤형 데이터 파이프라인을 구축하고, 소음이 많은 환경이나 대화 중 발생하는 방해도 정확히 처리하는 알고리즘을 개발해 기술적 완성도를 높였다.

Palabra AI image - 와우테일

팔라브라는 일반 사용자와 기업 고객을 모두 아우르는 제품을 제공한다. 개인 사용자를 위한 데스크톱 앱은 구글 미트, 줌, 디스코드, 슬랙, 마이크로소프트 팀즈 등 주요 화상 회의 플랫폼에서 30개 이상의 언어를 실시간으로 번역해준다. 이는 다양한 국적의 참가자들이 참여하는 글로벌 회의에서 큰 도움이 될 것으로 보인다. 

기업 고객에게는 API와 SDK를 제공하여 자사 서비스에 번역 기능을 손쉽게 통합할 수 있도록 지원한다. 현재 팔라브라의 기술은 영상 플랫폼 아고라의 다국어 라이브 스트리밍과 언어 서비스 기업 GIS 그룹의 통역 솔루션에 활용되고 있다.

실시간 번역 시장의 경쟁은 매우 치열하다. 소비자 시장에서는 Y Combinator의 지원을 받는 이지더브스(EzDubs)가 대면 대화나 통화 번역 앱을 개발하고 있으며, 구글도 최근 미트(Meet)에 실시간 번역 기능을 추가했다. 기업 시장에서는 두바이에 기반을 둔 캠브(Camb.AI)가 라이브 이벤트를 여러 언어로 방송하는 기술을 개발하는 등 경쟁자들이 속속 등장하고 있다.

팔라브라는 이러한 경쟁 환경 속에서 독자적인 기술력으로 승부수를 띄울 계획이다. 현재 개발 중인 새로운 스트리밍 예측 모델을 통해 번역 지연 시간을 획기적으로 줄이고, 동시에 10,000개 이상의 오디오 스트림을 처리할 수 있는 기술을 고도화하여 시장에서의 입지를 더욱 강화할 방침이다.

기사 공유하기

답글 남기기