메타, 음성 AI 스타트업 ‘웨이브폼스’ 인수


메타(Meta)가 음성 AI 기술력 강화를 위해 또 다른 대형 인수에 나섰다.

Waveforms ai logo - 와우테일

IT 전문매체 더 인포메이션은 9일(현지시간) 메타가 음성 이해 특화 AI 모델 개발업체인 웨이브폼스(Waveforms)를 인수했다고 보도했다. 구체적인 인수 금액은 공개되지 않았지만, 웨이브폼스가 지난해 12월 기업가치 2억 달러로 4천만 달러를 투자받은 점을 고려할 때 수억 달러 규모로 추정된다.

웨이브폼스는 2024년 설립된 신생기업으로, GPT-4의 음성 모드 개발에 참여한 오픈AI 출신 연구원 알렉시스 코노와 구글 출신 광고 전략가 코랄리 르메트르가 공동 창업했다. 특히 코노는 사용자가 음성으로 ChatGPT와 대화할 수 있게 해주는 핵심 기능을 개발한 인물로 알려져 있다.

웨이브폼스의 핵심 기술은 기존 음성 처리 방식의 한계를 뛰어넘는다는 점이다. 일반적으로 음성 AI는 ▲음성을 텍스트로 변환 ▲텍스트 기반 응답 생성 ▲응답을 다시 음성으로 변환하는 3단계 과정을 거친다. 반면 웨이브폼스는 이 모든 과정을 하나의 모델로 처리하는 ‘종단간 오디오 언어 모델’을 개발해 효율성을 크게 높였다.

더욱 주목할 점은 음성 속 감정 인식 기능이다. 웨이브폼스의 AI는 사용자 음성에서 감정적 단서를 파악해 이에 맞춰 응답을 조정할 수 있다. 이는 기존 음성 AI보다 훨씬 자연스러운 대화 경험을 제공할 것으로 기대된다.

메타는 최근 음성 AI 분야 투자를 가속화하고 있다. 지난달에는 고객 지원용 음성 AI 에이전트 개발업체인 플레이 AI도 인수했다. 플레이 AI는 매각 전 2천100만 달러를 조달한 바 있다.

메타 관계자는 내부 메모를 통해 “플레이 AI 인수가 메타 AI 챗봇의 음성 기능 향상에 도움이 될 것”이라고 밝혔다. 현재 메타 AI는 ChatGPT처럼 음성 명령을 지원하며, 인스타그램 릴스 동영상의 음성 번역 기능도 개발 중이다.

업계에서는 이번 웨이브폼스 인수가 메타의 AI 전략에서 중요한 전환점이 될 것으로 보고 있다. 확보한 기술은 메타 AI 챗봇 개선은 물론 주력 AI 모델인 ‘라마(Llama)’ 시리즈 고도화에도 활용될 전망이다. 라마 모델 중 상당수가 이미 음성 입력 처리 기능을 갖추고 있어 시너지 효과가 클 것으로 예상된다.

월스트리트저널은 메타의 AI 연구 전담 조직인 ‘TBD 랩스’가 현재 ‘라마 4.5’와 ‘라마 4.X’로 불리는 차세대 모델을 개발 중이라고 보도했다. 이 연구팀은 추론 능력 향상에 집중하고 있으며, 최근 오픈AI와 구글에서 영입한 연구진들이 대거 포진해 있다. 다만 신모델의 출시 시기와 오픈소스 공개 여부는 아직 확정되지 않은 상태다.

기사 공유하기

답글 남기기