구글, 제미나이 3 공개 “아이디어 실현 돕는 가장 똑똑한 모델”


구글이 19일 차세대 AI 모델 ‘제미나이 3(Gemini 3)’를 공개했다. 순다 피차이 구글 및 알파벳 CEO와 데미스 허사비스 구글 딥마인드 CEO는 제미나이 3가 전례 없는 수준의 깊이와 뉘앙스를 이해할 수 있도록 설계된 최첨단 추론 능력을 갖췄다고 밝혔다.

GOOGLE %EC%A0%9C%EB%AF%B8%EB%82%98%EC%9D%B4 3 %EB%B2%A4%EC%B9%98%EB%A7%88%ED%81%AC %EB%B9%84%EA%B5%90 1 - 와우테일

제미나이 3는 창의적인 아이디어 속 미묘한 단서를 포착하거나 복잡한 문제를 여러 겹의 층위로 나눠 풀어낼 수 있으며, 요청의 컨텍스트와 의도를 보다 정확하게 파악해 최소한의 프롬프트로도 원하는 결과를 얻을 수 있다. 피차이 CEO는 “불과 2년 만에 AI가 단순히 텍스트와 이미지를 읽는 데서 나아가 ‘분위기를 파악하는(reading the room)’ 수준으로 진화했다”고 설명했다.

구글은 서비스 출시 첫날부터 제미나이 모델을 검색에 전면 적용한다. 제미나이 3는 제미나이 앱, AI 스튜디오(AI Studio) 및 버텍스 AI(Vertex AI)의 개발자 툴, 그리고 새로운 에이전트 개발 플랫폼인 ‘구글 안티그래비티(Google Antigravity)’에도 적용된다.

제미나이는 약 2년 전 첫 선을 보인 이후 빠른 성장세를 보이고 있다. 현재 매달 20억 명이 ‘AI 개요(AI Overviews)’를 이용하고 있으며, 제미나이 앱의 월간 활성 이용자는 6억 5천만 명을 넘어섰다. 또한 구글 클라우드 고객의 70% 이상이 구글의 AI를 활용하고 있고, 1천 3백만 명의 개발자가 구글의 생성형 AI 모델을 기반으로 개발을 진행하고 있다.

제미나이 3 프로(Gemini 3 Pro) 프리뷰 버전은 최첨단 추론 및 멀티모달 기능을 통해 어떤 아이디어든 현실로 구현해 낸다. 이 모델은 LMArena 리더보드에서 1501점을 기록하며 기존 1위였던 제미나이 2.5 프로를 제치고 정상을 차지했다. 툴을 전혀 사용하지 않고 치른 Humanity’s Last Exam에서 최고 점수(37.5%)를, GPQA Diamond에서 91.9%를 기록하며 박사급 추론 능력을 입증했다. 또한 수학 분야에서 MathArena Apex에서 23.4%라는 신기록을 달성했다.

GOOGLE %EC%A0%9C%EB%AF%B8%EB%82%98%EC%9D%B4 3 %EB%B2%A4%EC%B9%98%EB%A7%88%ED%81%AC %EB%B9%84%EA%B5%90 4 - 와우테일

텍스트를 넘어 제미나이 3 프로는 MMMU-Pro에서 81%, Video-MMMU에서 87.6%를 기록하며 멀티모달 추론 능력을 재정의했다. 또한 사실적 정확성을 보여주는 SimpleQA Verified에서 72.1%로 최고 기록을 세우며 큰 진전을 이뤘다. 이는 제미나이 3 프로가 과학, 수학 등 방대한 주제에 걸친 복잡한 문제들을 높은 신뢰도로 해결할 수 있음을 의미한다.

제미나이 3 프로는 모든 상호작용에 새로운 수준의 깊이와 뉘앙스를 더한다. 답변은 똑똑하고 간결하며 직설적이다. 상투적인 문구와 아첨을 지양하고 진정한 통찰을 제공하며, 단순히 이용자가 듣고 싶어 하는 말이 아니라 꼭 필요한 조언을 해준다. 복잡한 과학적 개념을 고해상도 시각화 코드로 변환하는 것부터 창의적인 브레인스토밍에 이르기까지 정보를 이해하고 자신을 표현하는 새로운 방식을 제시하는 진정한 ‘사고의 파트너(thought partner)’가 되어준다.

구글은 제미나이 3의 성능을 한 단계 더 끌어올린 강화된 추론 모드인 ‘제미나이 3 딥 씽크(Gemini 3 Deep Think)’도 함께 선보였다. 이 기능은 구글 AI 울트라(Google AI Ultra) 구독자에게 제공하기 전 안전성 테스터(safety testers)에 사전 제공된다.

테스트 결과 제미나이 3 딥 씽크는 이미 인상적인 제미나이 3 프로의 성능을 뛰어넘어 Humanity’s Last Exam에서 우수한 점수를 기록했으며(툴 없이 사용 시 41.0%), GPQA Diamond에서 93.8%를 기록했다. 또 새로운 유형의 문제 해결 능력을 평가하는 ARC-AGI-2(코드 실행 포함, ARC Prize 인증)에서는 전례 없는 45.1%의 점수를 기록하며 혁신적인 추론 역량을 보여주었다.

제미나이 3는 설계 초기부터 텍스트, 이미지, 비디오, 오디오, 코드 등 다양한 양식(modality)을 넘나들며 모든 주제의 정보를 유기적으로 종합하도록 만들어졌다. 제미나이 3는 멀티모달 추론의 최전선을 넓혀 최첨단 추론 능력, 시각 및 공간 이해력, 뛰어난 다국어 성능, 그리고 100만 토큰 컨텍스트 윈도우를 결합해 이용자에게 가장 효율적인 학습 방식을 제공한다.

구글 검색(Search)의 AI 모드는 이제 제미나이 3를 활용해 이용자의 검색 의도에 맞춰 즉석에서 생성되는 몰입형 시각 레이아웃, 대화형 도구, 시뮬레이션 같은 새로운 ‘생성형 UI'(generative UI) 경험을 제공한다.

제미나이 3는 2.5 프로의 성공을 발판 삼아 개발자가 어떤 아이디어든 현실로 구현할 수 있도록 돕는다. 제로 샷(zero-shot) 생성 능력이 탁월하며, 복잡한 프롬프트와 지침도 척척 처리해 더욱 풍성하고 상호작용이 뛰어난 웹 UI를 구현해 낸다.

제미나이 3는 지금까지 개발된 모델 중 최고의 ‘바이브 코딩(vibe coding)’ 및 ‘에이전트 코딩’ 성능을 자랑하며, 구글 제품을 더욱 자율적으로 만들고 개발자의 생산성을 극대화한다. WebDev Arena 리더보드에서 1,487 Elo를 기록했고, 터미널을 통해 컴퓨터를 조작하는 도구 사용 능력을 테스트하는 Terminal-Bench 2.0에서는 54.2%를 기록했다. 또한 코딩 에이전트 성능 벤치마크인 SWE-bench Verified(76.2%)에서도 제미나이 2.5 프로를 크게 앞섰다.

GOOGLE %EC%A0%9C%EB%AF%B8%EB%82%98%EC%9D%B4 3 %EB%B2%A4%EC%B9%98%EB%A7%88%ED%81%AC %EB%B9%84%EA%B5%90 3 - 와우테일

이제 구글 AI Studio, Vertex AI, Gemini CLI, 그리고 구글의 새로운 에이전트 개발 플랫폼인 구글 안티그래비티(Google Antigravity)에서도 제미나이 3를 이용해 개발할 수 있다. 또한 커서(Cursor), 깃허브(GitHub), 젯브레인스(JetBrains), 마누스(Manus), 레플릿(Replit)과 같은 서드 파티 플랫폼에서도 활용할 수 있다.

구글은 개발자가 단순 코딩을 넘어 더 높은 차원의 ‘과업 중심(task-oriented)’으로 일할 수 있게 해주는 새로운 에이전트 개발 플랫폼 구글 안티그래비티(Google Antigravity)를 선보였다. 제미나이 3의 고도화된 추론, 툴 활용, 에이전트 코딩 능력을 기반으로 하는 구글 안티그래비티는 AI 어시스턴트를 단순한 도구에서 능동적인 파트너로 격상시킨다.

핵심 인터페이스는 익숙한 AI IDE 형태지만, 그 안의 에이전트들은 독립적인 작업 공간을 부여받아 편집기, 터미널, 브라우저에 직접 접근할 수 있다. 이제 에이전트는 코드를 검증하는 동시에 이용자를 대신해 복잡한 엔드투엔드 소프트웨어 작업을 스스로 계획하고 실행할 수 있다.

제미나이 3는 가상의 자판기 비즈니스를 운영하며 장기간에 걸친 일관성을 평가하는 Vending-Bench 2에서 리더보드 1위를 차지하며 장기 계획(long-horizon planning) 능력을 입증했다. 이 모델은 시뮬레이션 상의 1년이라는 기간 동안 일관된 툴 사용과 의사 결정을 유지하며 작업에서 이탈하지 않고 더 높은 수익을 창출했다.

더 깊이 있는 추론과 한층 개선된 툴 활용 능력을 결합해 제미나이 3는 메일함을 정리하거나 예약을 하는 것과 같은 복잡한 다단계 워크플로우를 처음부터 끝까지 이용자를 대신해 실행에 옮길 수 있다. 물론 이 모든 과정은 이용자의 통제와 가이드 아래 이루어진다.

구글 AI 울트라 구독자는 이날부터 제미나이 앱의 제미나이 에이전트(Gemini Agent)를 통해 이러한 에이전트 기능을 체험해 볼 수 있다. 구글은 에이전트 기능을 고도화하며 많은 것을 배웠으며, 곧 더 많은 구글 제품으로 이 기능을 확장할 계획이다.

GOOGLE %EC%A0%9C%EB%AF%B8%EB%82%98%EC%9D%B4 3 %EB%B2%A4%EC%B9%98%EB%A7%88%ED%81%AC %EB%B9%84%EA%B5%90 2 - 와우테일

제미나이 3는 지금까지 구글이 선보인 모델 중 가장 안전하며, 역대 구글 AI 모델 중 가장 포괄적인 안전 평가를 거쳤다. 이 모델은 과도한 긍정 반응(sycophancy)을 줄였고, 프롬프트 주입(prompt injection) 공격에 대한 저항력을 높였으며, 사이버 공격에 대해 강력한 방어 능력을 갖췄다.

구글의 프런티어 안전 프레임워크(Frontier Safety Framework)가 규정한 핵심 영역에 대한 내부 테스트는 물론, 세계 최고의 분야별 전문가들과 협력해 평가를 수행했다. 또한 영국 AI 안전 연구소(UK AI Security Institute)에 조기 접근 권한을 제공하고 Apollo, Vaultis, Dreadnode 등 업계 전문 기관으로부터 독립적인 평가를 받았다.

제미나이 3는 이날부터 순차적으로 출시되며, 제미나이 앱의 모든 이용자(AI 모드 검색의 경우 미국 내 구글 AI 프로 및 울트라 구독자 대상 출시), 구글 AI 스튜디오의 제미나이 API 개발자, 구글의 새로운 에이전트 개발 플랫폼 구글 안티그래비티 개발자 및 제미나이 CLI 개발자, 버텍스 AI 및 제미나이 엔터프라이즈(Gemini Enterprise)를 이용하는 기업고객을 대상으로 제공된다.

제미나이 3 딥 씽크 모드는 몇 주 내로 구글 AI 울트라 구독자에게 공개되기에 앞서 안전 테스터들의 피드백을 수렴하는 안전성 평가를 먼저 진행할 예정이다. 구글은 AI로 더 많은 것을 가능케 하기 위해 제미나이 3 시리즈의 추가 모델도 곧 선보일 계획이다.

GOOGLE %EC%A0%9C%EB%AF%B8%EB%82%98%EC%9D%B4 3 %EB%B2%A4%EC%B9%98%EB%A7%88%ED%81%AC %EB%B9%84%EA%B5%90 1 - 와우테일

기사 공유하기

답글 남기기