AI All

가우디오랩, AI 기술로 가사-음원 자동 동기화

2021-04-27 2 min read

가우디오랩, AI 기술로 가사-음원 자동 동기화

Reading Time: 2 minutes

가우디오랩오디오 인공지능 기술을 활용해 가사와 음원을 자동으로 동기화하여 실시간 가사 보기 기능을 제공할 수 있도록 하는 솔루션인 GTS(Gaudio Text Sync)를 출시하고, 국내 대표 음원 스트리밍 서비스 중 하나인 벅스(Bugs)를 통해 상용화에 성공했다고 밝혔다.

GTS는 가우디오랩의 독자적인 오디오 기술로 개발된 인공지능 기반 가사 동기화 솔루션이다. 지금껏 ‘타임 코더’라 불리는 인력이 직접 투입돼 매 곡마다 일일이 가사와 음원의 시점(Time sync)을 맞추던 문제를 자체 AI기술을 통해 풀어냈다. 

GTS 솔루션은 정확히 싱크된 가사를 빠르게 생성해 서비스할 수 있어, 스트리밍 서비스 담당자는 물론 이용자 만족도 향상에도 기여하고 있다. 하루에 새롭게 발매되는 음반의 수가 수만 장, 트랙 수로는 수십만 곡에 이르는 현 음원시장에서는 수작업으로 모든 곡에 싱크 가사를 생성하는 것이 사실상 불가능하다. 반면, GTS 엔진이 장착된 서버 1대면 하루 약 7만 곡을 처리할 수 있다.

현재 음원 스트리밍 서비스사가 보유한 곡은 각 사 별로 약 4천만에서 7천만 곡 정도의 규모이나, 실시간 가사가 제공되는 곡은 아직 수십만 곡에 그친다. 실시간 가사 입력을 위해 소요되는 수작업 인력과 시간 비용 문제 때문이다. 이번 GTS 상용화를 통해 음원 서비스사가 제공하는 사실상 모든 곡에 대해 실시간 가사 보기가 가능한 시대가 열린 셈이다.

가우디오랩 전상배 최고과학책임자(CSO)는 “음원 스트리밍 서비스를 이용할 때 동기화에 오류가 있는 가사를 제공하거나 싱크 가사가 아닌 일반 가사를 제공하는 경우가 많은데, 가우디오랩의 기술을 활용하면 빠르고 정확하게 많은 곡에 대한 싱크 가사를 제공할 수 있다”며, “잘못된 가사의 오류를 검출하는 기능 탑재로 가사의 품질 관리도 가능하고, 한국어, 영어, 중국어 등 다양한 언어를 지원하는 만큼, 전 세계 음원 서비스에 적용되어 사용자들의 음악을 듣는 경험을 더욱 향상시킬 수 있을 것”이라고 말했다. 

한편, 가우디오랩은 헤드폰 입체 음향 기술의 ISO/IEC MPEG-H 국제표준 채택을 계기로 2015년 설립된 오디오 기술 스타트업이다. OTT, 스트리밍, AR/VR, 스마트폰, TV, 극장 등 소리가 있는 어디에서나 훌륭한 소리 경험을 제공할 수 있는 오디오 솔루션을 제공한다. 2017년에 올해의 최고 VR 혁신 기업상 수상(VR Awards)하였으며, 소프트뱅크벤처스, 캡스톤파트너스, 한국투자파트너스, LB인베스트먼트로부터 투자를 유치했다.

[대화형 인공지능(Conversational AI) 관련 소식 전체보기]


투자자와 창업팀의 간극을 메울 수 있는 컨텐츠에 관심이 많은 초기 스타트업 투자자이자 와우테일(wowtale) 편집장(Chief Editor)이다. Linkedin Facebook투자실적