AI 비디오에 사운드 제공 ‘미렐로’, 4100만 달러 시드 투자유치


베를린 기반 AI 오디오 스타트업 미렐로(Mirelo)가 인덱스 벤처스(Index Ventures)와 안드레센 호로위츠(Andreessen Horowitz)가 공동 주도한 시드 라운드에서 4100만 달러를 유치했다. 어틀랜틱(Atlantic.vc)과 트리플포인트 캐피털(TriplePoint Capital)도 투자에 참여했으며, 총 누적 투자금은 4400만 달러가 됐다.

mirelo ai founders - 와우테일

AI 비디오 생성 툴이 폭발적으로 늘어나는 가운데, 정작 대부분의 영상은 소리 없이 만들어진다. 미렐로는 이 문제를 해결하기 위해 영상을 분석해 동작과 맥락에 맞는 사운드 이펙트를 자동으로 생성하는 AI 모델을 개발했다. “소리는 영화 경험의 50%”라는 조지 루카스의 말처럼, 같은 영상이라도 어떤 사운드를 입히느냐에 따라 전혀 다른 분위기와 긴장감을 만들 수 있다는 게 미렐로의 핵심 철학이다.

창업자인 CJ 시몬-가브리엘 플로리안 벤젤은 AI 연구자이자 음악가다. 두 사람은 아마존 AWS 연구소에서 만나 의기투합했다. AI가 텍스트와 이미지 생성에만 집중하는 동안 오디오는 뒤처지고 있다는 공통된 문제의식을 공유했기 때문이다. 시몬-가브리엘은 막스 플랑크 연구소에서 머신러닝 박사학위를 받았고 취리히 연방공대에서 박사후 연구원을 지냈다. 스트라스부르 음악원에서 피아노·오르간·작곡을 전공해 전문 음악가로 활동할 뻔했다. 벤젤은 구글 브레인 베를린 출신으로, 현재도 베를린에서 일렉트로 밴드 기타리스트로 활동 중이다.

올해 초 공개한 미렐로 SFX v1.5는 영상을 업로드하면 몇 초 만에 완벽히 동기화된 사운드를 여러 버전으로 만들어낸다. 일반적인 대규모 언어 모델보다 50배 적은 연산력으로 작동하면서도 외부 평가에서 경쟁사보다 우수한 품질을 보였다는 게 회사 측 설명이다. 현재 10명 규모인 팀은 내년 말까지 2~3배로 늘어날 예정이다. 단기적으로는 팰AI(Fal.ai)과 레플리케이트(Replicate)를 통한 API 사용료가 주요 수익원이 될 전망이며, 크리에이터용 웹 작업 공간인 ‘미렐로 스튜디오’도 개발 중이다. 월 20유로(약 23.5달러) 수준의 유료 플랜도 운영한다.

경쟁은 치열하다. 소니와 텐센트가 비디오-투-사운드 이펙트 모델을 내놨고, 중국의 링(Kling) AI도 유사한 기능을 선보였다. 특히 일레븐랩스(ElevenLabs)는 올해 1월 1억 8000만 달러 시리즈 C 투자를 유치하며 기업가치 33억 달러로 평가받았다(최근 구주 매각을 통해 회사 가치는 66억 달러까지 치솟았다). AI 음성 합성에서 출발해 사운드 이펙트와 음악 생성까지 영역을 확장하고 있다.

미렐로는 음악 생성이 아닌 사운드 이펙트에만 집중하는 전략으로 맞선다. 시몬-가브리엘 CEO는 “이 분야는 연구가 덜 된 영역이라 경쟁 해자를 구축하기 유리하다”고 설명했다. 음악 생성은 장기 로드맵에 있지만, 지금은 좁은 틈새에서 깊이를 쌓는 데 집중한다는 전략이다.

학습 데이터 문제에도 신중하게 접근한다. 인덱스 벤처스에 따르면 미렐로는 퍼블릭 도메인과 라이선스를 구매한 사운드 라이브러리로 모델을 학습시키며, 아티스트의 권리를 존중하는 수익 분배 파트너십도 체결했다. AI 음악 플랫폼 수노(Suno)가 지난 11월 2억 5000만 달러를 유치하며 기업가치 24억 5000만 달러로 평가받았지만, 동시에 유니버설·소니·워너 등 3대 음반사로부터 저작권 침해 소송을 받고 있는 것과 대조적이다.

“무성 영화와 유성 영화의 차이를 생각해보라”는 시몬-가브리엘의 말처럼, 구글의 제미니 비디오 생성기가 딥마인드의 Veo 3.1 오디오 모델을 통합하는 등 대형 플레이어들도 비디오 사운드에 주목하기 시작했다. 미렐로는 미스트랄 CEO 아르튀르 멘슈, 허깅페이스 수석과학자 토마스 울프, 팰AI 공동창업자 버케이 구르 등 AI 업계 인사들로부터 엔젤 투자도 받았다.

기사 공유하기

답글 남기기