구글 I/O 2025, 차세대 AI 생태계 구축으로 혁신 가속화


구글이 21일(현지시간) 개최한 연례 개발자 컨퍼런스 ‘I/O 2025’에서 순다 피차이 CEO는 인공지능 모델 ‘제미나이’를 중심으로 한 광범위한 기술 혁신과 다양한 신제품을 공개했다. 이번 행사에서는 모델 성능 강화, 차세대 하드웨어 인프라, 그리고 이를 활용한 혁신적인 사용자 경험에 대한 비전이 제시됐다.

google IO 2025 keynote - 와우테일

제미나이 모델의 비약적 성능 강화

피차이 CEO는 제미나이 모델의 급속한 발전을 주요 성과로 강조했다. 1세대 제미나이 프로 출시 이후 성능을 나타내는 Elo 점수가 300점 이상 상승했으며, 현재 제미나이 2.5 프로는 LMArena 리더보드의 모든 부문에서 선두를 달리고 있다고 밝혔다.

특히 새로운 제미나이 2.5 플래시는 추론, 멀티모달리티, 코드 생성, 긴 컨텍스트 처리 능력 등 거의 모든 측면에서 향상됐으며, LMArena 리더보드에서도 제미나이 2.5 프로에 이어 2위를 차지했다. 또한 제미나이 2.5 프로는 ‘딥 씽크’라는 고급 추론 모드를 통해 병렬 사고 기법을 포함한 최신 연구 결과를 활용해 더욱 강화됐다.

첨단 AI 인프라 확충

이러한 AI 모델의 발전은 구글의 최첨단 컴퓨팅 인프라가 뒷받침했다. 피차이 CEO는 7세대 TPU인 ‘아이언우드’를 소개하며 이것이 AI의 사고와 추론 워크로드를 대규모로 처리하도록 특별히 설계된 최초의 TPU라고 설명했다. 아이언우드는 이전 세대보다 10배 높은 성능을 제공하며 포드당 42.5 엑사플롭스의 연산 능력을 갖추고 있어 향후 AI 모델의 더 빠른 훈련과 추론을 가능하게 한다.

이러한 인프라 발전으로 모델 비용이 크게 낮아지는 상황에서도 훨씬 더 빠른 모델을 제공할 수 있게 됐다고 피차이는 강조했다.

글로벌 AI 도입 가속화 지표

구글은 AI 기술의 글로벌 도입이 예상보다 빠르게 진행되고 있다고 발표했다. 현재 구글은 제품과 API를 통해 한 달에 480조 개 이상의 토큰을 처리하고 있으며, 이는 작년 9.7조 개에서 50배 증가한 수치다.

제미나이를 활용 중인 개발자 수는 700만 명 이상으로 작년 대비 5배 늘어났으며, 버텍스 AI에서의 제미나이 사용량은 40배 증가했다. 또한 제미나이 앱의 월간 활성 이용자 수는 4억 명을 넘었으며, 특히 제미나이 앱에서 제미나이 2.5 프로의 사용량이 45% 증가하는 등 신형 모델에 대한 사용자 수요가 급증하고 있다.

구글은 이번 행사를 통해 혁신적인 제품과 서비스를 다수 공개했다. 

구글 빔(Google Beam)

피차이는 몇 년 전 I/O에서 처음 선보였던 3D 비디오 기술 ‘프로젝트 스타라인’이 발전해 새로운 AI 중심 영상 커뮤니케이션 플랫폼 ‘구글 빔(Google Beam)’으로 진화했다고 발표했다. 구글 빔은 최첨단 비디오 모델을 사용해 2D 비디오 스트림을 사실적인 3D 경험으로 변환한다.

6대의 카메라 배열과 AI를 이용해 비디오 스트림을 병합하고, 3D 라이트필드 디스플레이에 렌더링해 사용자의 모습을 사실적으로 구현한다. 이 플랫폼은 밀리미터 단위의 정밀한 헤드 트래킹과 초당 60프레임의 실시간 처리로 자연스럽고 몰입감 있는 대화 경험을 제공한다. HP와의 협업을 통해 첫 번째 구글 빔 기기가 올해 말 초기 고객들에게 출시될 예정이다.

YouTube 동영상

실시간 음성 번역 기능

구글 미트에 언어 장벽을 허물 수 있는 음성 번역 기능이 도입된다. 이 기능은 실시간에 가깝게 화자의 목소리와 톤, 심지어 표현까지 매칭시켜 여러 언어 간 자연스럽고 유창한 대화를 가능하게 한다. 영어 및 스페인어 번역은 구글 AI 프로 및 구글 AI 울트라 구독자를 대상으로 베타 버전으로 제공되며, 향후 몇 주 내 더 많은 언어가 추가될 예정이다. 이 기능은 올해 기업용 구글 워크스페이스 고객에게도 초기 테스트 형태로 제공된다.

YouTube 동영상

제미나이 라이브와 카메라 기능

프로젝트 아스트라에서 발전한 ‘제미나이 라이브’는 카메라 및 화면 공유 기능을 통합해 사용자가 면접 준비부터 마라톤 훈련까지 다양한 방식으로 활용할 수 있도록 지원한다. 이 기능은 이미 모든 안드로이드 사용자에게 제공되고 있으며, 이제 iOS 사용자에게도 순차적으로 출시될 예정이다.

에이전트 모드와 웹 자동화

‘프로젝트 마리너’는 웹과 상호작용하며 사용자의 작업을 대신 수행할 수 있는 컴퓨터 처리 능력을 갖춘 에이전트 시스템으로 발전했다. 이 프로토타입은 새로운 멀티태스킹 기능과 ‘가르치고 반복하기’ 방식을 통해 많은 진전을 이루었다.

프로젝트 마리너의 컴퓨터 처리 기능은 제미나이 API를 통해 개발자에게 제공되며, Automation Anywhere 및 UiPath 등의 기업들이 이미 활용하기 시작했다. 에이전트 기능은 크롬, 구글 검색 및 제미나이 앱에도 도입되며, 특히 제미나이 앱의 새로운 에이전트 모드는 사용자가 더 복잡한 작업을 효율적으로 처리할 수 있도록 지원한다. 이 에이전트 모드는 곧 제미나이 앱 구독자들에게 제공될 예정이다.

개인화 서비스 강화

피차이는 ‘개인 컨텍스트’ 기능을 통해 개인화 서비스를 크게 강화한다고 발표했다. 사용자의 허락 하에 제미나이 모델은 사용자의 구글 앱 전반에 걸쳐 관련 개인 정보를 활용할 수 있게 된다.

이에 대한 예로 지메일의 새로운 ‘개인화된 스마트 답장’ 기능이 소개됐다. 친구가 과거에 다녀온 여행에 대해 조언을 구하는 이메일을 보내면, 제미나이는 과거 이메일과 구글 드라이브의 파일을 검색하여 구체적인 세부 정보가 포함된 답장을 제안해 줄 수 있다. 또한 사용자의 평소 인사말, 어조와 스타일, 심지어 즐겨 쓰는 단어 선택까지 포착하여 자연스러운 답장을 생성한다. 이 기능은 올해 말 구독자들을 대상으로 제공될 예정이다.

구글 검색의 AI 혁신

AI 기술은 구글의 핵심 서비스인 검색에도 큰 변화를 가져오고 있다. 지난해 출시된 ‘AI 개요’ 기능은 이미 15억 명 이상의 사용자가 이용하고 있으며, 현재 200개 국가 및 지역에서 이용 가능하다. 사용자들은 AI 개요를 통해 검색 결과에 더 만족하고 검색 빈도도 높아지고 있다고 피차이는 설명했다.

이에 더해 구글은 엔드투엔드 AI 검색 경험을 원하는 사용자를 위해 완전히 새로운 ‘AI 모드’를 선보인다. 향상된 추론 기능을 통해 AI 모드에서는 더 길고 복잡한 쿼리를 질문할 수 있으며, 초기 테스터들은 기존 검색어보다 2~3배 긴 쿼리를 사용하고 있다. 이 기능은 오늘부터 미국 내 모든 사용자에게 제공되며, 이번 주부터 제미나이 2.5도 미국 내 구글 검색에 도입될 예정이다.

생성형 미디어 모델의 발전

구글은 네이티브 오디오 생성을 지원하는 최신 비디오 모델인 ‘비오 3(Veo 3)’와 최신 이미지 생성 모델인 ‘이마젠 4(Imagen 4)’를 공개했다. 두 모델 모두 제미나이 앱에서 이용 가능하며, 사용자들의 창의력을 확장시킬 전망이다.

또한 구글은 ‘플로우(Flow)’라는 새로운 툴을 통해 영화 제작자들에게 영화 같은 클립을 만들고, 짧은 클립을 더 긴 장면으로 확장할 수 있는 기능을 제공한다. 이는 영상 제작 분야에 새로운 가능성을 열어줄 것으로 기대된다.

미래 비전

피차이 CEO는 키노트 마무리에서 “AI가 제공하는 기회는 실로 막대하며, 그 혜택이 가능한 한 많은 사람에게 돌아갈 수 있도록 하는 것은 이번 세대의 개발자, 기술 구축자, 그리고 문제 해결사들의 손에 달려 있다”고 강조했다.

또한 “로보틱스에서 양자 컴퓨팅, 알파폴드, 웨이모에 이르기까지, 오늘날 구글이 연구하는 것들이 미래에 마주할 현실의 토대가 될 것”이라고 전망하며, 기술이 사람들에게 영감을 주고 경이로움을 선사하는 힘을 가졌다고 언급했다.

기사 공유하기

답글 남기기