유튜브, 숏폼 콘텐츠 제작 혁신 선언… ‘Veo 3’ 도입으로 쉬운 영상 제작 시대 연다


유튜브(YouTube)가 숏폼 콘텐츠 제작의 패러다임을 바꿀 혁신적인 AI 도구들을 선보였다. 16일(현지시간) 뉴욕 피어 57에서 개최된 ‘메이드 온 유튜브 2025’ 행사에서 구글 딥마인드가 개발한 최첨단 텍스트-투-비디오 AI 모델 ‘Veo 3’의 맞춤형 버전을 유튜브 숏츠에 탑재한다고 발표했다.

MoYT25 EventCard Blue.max 700x3000.format webp - 와우테일

이번에 공개된 ‘Veo 3 Fast’는 기존 AI 영상 생성 도구들과 차별화된 성능을 자랑한다. 480p 해상도에서 빠른 속도로 영상을 생성할 뿐만 아니라, 업계 최초로 사운드까지 동시에 제작할 수 있는 기능을 갖췄다. 사용자는 스마트폰만 있으면 간단한 텍스트 프롬프트 입력만으로 아이디어를 완성된 영상으로 구현할 수 있다. 무엇보다 이 모든 기능이 무료로 제공된다는 점이 주목할 만하다.

현재 이 서비스는 미국, 영국, 캐나다, 호주, 뉴질랜드 5개국에서 먼저 시작되며, 유튜브 측은 가까운 시일 내에 서비스 지역을 전 세계로 확대할 계획이라고 밝혔다. 국내 창작자들도 곧 이런 혁신적인 도구를 활용할 수 있을 것으로 기대된다.

유튜브는 단순한 영상 생성을 넘어 창작자들의 상상력을 현실로 구현할 수 있는 다양한 Veo 기반 기능들을 준비하고 있다. ‘모션 전이’ 기능은 정지된 사진에 생동감을 불어넣는다. 예를 들어 평범한 인물 사진에 다른 영상의 댄스 동작이나 스포츠 움직임을 적용해 역동적인 애니메이션으로 변환할 수 있다. 이는 한 피사체의 움직임을 포착해 다른 피사체로 전달하는 고도의 AI 기술을 통해 가능해졌다.

‘스타일 변환’ 기능도 흥미롭다. 일반적인 영상을 팝아트나 종이접기 스타일로 완전히 다른 느낌으로 바꿀 수 있다. 창작자들은 이제 복잡한 후처리 작업 없이도 버튼 한 번으로 자신의 영상에 독특한 예술적 효과를 입힐 수 있게 됐다. ‘오브젝트 추가’ 기능은 더욱 창의적이다. 텍스트 설명만으로 영상에 새로운 요소를 자연스럽게 삽입할 수 있다. 아침 커피 장면에 고무 오리를 추가하거나, 항구 풍경에 거대한 문어가 배를 뒤집는 장면을 연출하는 것도 가능하다.

가장 혁신적인 기능으로 평가받는 것은 ‘스피치 투 송’ 리믹스 도구다. 이 기능은 기존 영상의 대화나 음성을 구글 딥마인드의 최첨단 AI 음악 모델 ‘리리아 2’를 활용해 매력적인 사운드트랙으로 탈바꿈시킨다. 재미있는 대사나 기억에 남는 명언, 독특한 음성에서 영감을 받아 완전히 새로운 음악을 만들어낼 수 있는 셈이다.

창작자들은 여기에 자신만의 개성을 더할 수 있다. ‘차분한’, ‘댄서블한’, ‘펀키한’ 등의 분위기를 선택하면 AI가 그에 맞는 음악적 색깔을 입혀준다. 유튜브 숏츠 및 생성형 AI 제작 부문을 총괄하는 디나 베라다 디렉터는 “세계 최대 규모의 창작 놀이터인 유튜브에서 트렌드가 탄생하고 영감을 얻는다”며 “한 줄의 대화에서 아이디어가 떠오르면 그것을 새로운 사운드로 리믹스할 수 있게 됐다”고 설명했다.

창작 과정의 부담을 획기적으로 줄여주는 ‘AI 편집’ 기능도 주목받고 있다. 많은 창작자들이 겪는 ‘빈 타임라인 앞에서의 막막함’을 해결해주는 이 기능은 스마트폰에 저장된 원본 영상들을 분석해 가장 매력적인 순간들을 자동으로 찾아낸다. 여기에 적절한 음악과 자연스러운 전환 효과를 추가하고, 영상 내용에 맞는 보이스오버까지 생성해 완성도 높은 초안을 만들어준다. 보이스오버는 현재 영어와 힌디어를 지원하며, 향후 더 많은 언어로 확대될 예정이다.

이 기능의 핵심은 창작자들이 기술적인 편집 작업에 시간을 쏟는 대신 자신만의 창의적 비전을 구현하는 데 집중할 수 있도록 돕는 것이다. AI가 만든 초안을 바탕으로 창작자는 개인화 작업과 세부 조정에만 신경 쓰면 된다.

팟캐스트 분야에서도 큰 변화가 예고됐다. 최근 몇 년간 팟캐스트의 영상화가 가속화되면서 유튜브는 이 트렌드에 맞는 전용 도구들을 개발했다. 비디오 팟캐스트 창작자들은 AI의 도움을 받아 긴 에피소드에서 핵심 부분을 쉽게 클립으로 추출할 수 있다. 이 클립들을 유튜브 숏츠로 변환하는 기능은 2026년 초 정식 출시될 예정이다.

오디오 전용 팟캐스트 창작자들을 위한 지원도 강화된다. 비디오 제작 시간이나 자원이 부족한 창작자들은 AI를 통해 오디오 파일만으로도 맞춤형 영상을 생성할 수 있게 된다. 다만 이 기능은 초기에는 선별된 팟캐스트 창작자들에게만 제공되며, 2026년 하반기에 본격적인 확대가 이뤄질 계획이다.

유튜브의 팟캐스트 영향력은 이미 상당한 수준에 도달했다. 올해 2월 발표에 따르면 유튜브의 월간 팟캐스트 시청자는 10억 명을 돌파했으며, 2025년 7월 기준으로는 매일 1억 시간 이상의 팟캐스트 콘텐츠가 소비되고 있다. 특히 전체 팟캐스트 시청 시간의 30% 이상이 라이브스트림이나 프리미어로 시작된다는 점도 흥미롭다.

이러한 AI 도구들의 대대적인 도입은 유튜브가 숏폼 콘텐츠 시장에서 틱톡, 인스타그램 릴스 등 강력한 경쟁자들에 맞서 차별화된 경쟁력을 확보하려는 전략적 움직임으로 해석된다. 특히 창작 도구의 혁신을 통해 더 많은 창작자들을 플랫폼으로 끌어들이고, 기존 창작자들의 만족도를 높여 생태계를 더욱 공고히 하려는 의도로 보인다.

업계 전문가들은 이번 발표가 콘텐츠 제작 민주화에 큰 기여를 할 것으로 전망하고 있다. 전문적인 영상 편집 기술이나 값비싼 장비 없이도 누구나 고품질의 숏폼 콘텐츠를 제작할 수 있게 되면서, 창작의 진입장벽이 크게 낮아질 것으로 예상된다. 이는 더 다양하고 창의적인 콘텐츠의 등장으로 이어질 가능성이 높다.

다만 AI 생성 콘텐츠의 급증에 따른 우려도 제기되고 있다. 이에 대해 유튜브는 투명성 확보를 위한 대책을 마련했다고 밝혔다. 구글 딥마인드가 개발한 ‘신스아이디’ 워터마크 기술과 명확한 콘텐츠 라벨링을 통해 AI로 생성된 영상임을 표시한다. 이를 통해 시청자들이 AI 생성 콘텐츠와 일반 콘텐츠를 명확히 구분할 수 있도록 했다.

유튜브는 또한 지난 4년간(2021년 1월~2024년 12월) 창작자, 아티스트, 미디어 기업들에게 총 1000억 달러 이상을 지급했다는 놀라운 통계도 공개했다. 이는 플랫폼이 창작자 생태계에 얼마나 많은 투자를 하고 있는지를 보여주는 대목이다.

앞으로 몇 달 안에 순차적으로 출시될 이들 AI 도구들은 콘텐츠 제작 방식을 근본적으로 바꿀 것으로 전망된다. 아이디어만 있으면 누구나 매력적인 영상을 만들 수 있는 시대가 본격적으로 시작되는 셈이다. 특히 한국의 창작자들도 이런 혁신적인 도구들을 활용해 글로벌 무대에서 더욱 경쟁력 있는 콘텐츠를 선보일 수 있을 것으로 기대된다.

YouTube 동영상

기사 공유하기

답글 남기기