구글, 이미지 편집 AI ‘나노 바나나’로 챗GPT 따라잡기 나서


구글이 OpenAI의 인기 이미지 도구와 경쟁하고 ChatGPT 사용자를 끌어들이기 위해 제미나이(Gemini) 챗봇에 강력한 AI 이미지 편집 기능을 탑재했다고 발표했다. ‘제미나이 2.5 플래시 이미지(Gemini 2.5 Flash Image)’라는 새로운 업데이트는 지난 화요일부터 모든 제미나이 앱 사용자에게 제공되며, 개발자들도 제미나이 API, 구글 AI 스튜디오, 버텍스 AI 플랫폼을 통해 접근할 수 있다.

google nano banana - 와우테일

새로운 제미나이 이미지 모델의 가장 큰 특징은 사용자의 자연어 요청을 기반으로 이미지를 더욱 정밀하게 편집하면서도 얼굴, 동물, 기타 세부사항의 일관성을 유지한다는 점이다. 이는 대부분의 경쟁 도구들이 어려워하는 영역으로, ChatGPT나 xAI의 그록(Grok)에서 사진 속 누군가의 셔츠 색깔을 바꿔달라고 요청하면 얼굴이 왜곡되거나 배경이 변형되는 경우가 많다. 구글의 새 모델은 이런 문제를 해결했다고 주장한다.

사실 이 모델은 이미 AI 커뮤니티에서 화제였다. 최근 몇 주간 소셜미디어 사용자들은 크라우드소싱 평가 플랫폼인 LM아레나(LMArena)에서 ‘나노 바나나(nano-banana)’라는 익명의 가명으로 등장한 인상적인 AI 이미지 편집기에 열광했다. 구글은 바나나 관련 힌트들로 암시해 왔으며, 이 모델이 주력 제미나이 2.5 플래시 AI 모델 내의 네이티브 이미지 기능이라고 밝혔다. 구글에 따르면 이 이미지 모델은 LM아레나와 기타 벤치마크에서 최첨단 성능을 보여준다.

구글 딥마인드의 비주얼 생성 모델 제품 책임자 니콜 브리히토바(Nicole Brichtova)는 “시각적 품질을 크게 향상시켰을 뿐만 아니라 모델의 지시 따르기 능력도 개선했다”며 “이번 업데이트는 훨씬 더 매끄럽게 편집을 수행하며, 모델의 결과물은 사용자가 원하는 목적에 활용할 수 있다”고 설명했다.

AI 이미지 모델은 빅테크 기업들의 중요한 경쟁 무대가 되었다. OpenAI가 3월 GPT-4o의 네이티브 이미지 생성기를 출시했을 때, AI가 생성한 스튜디오 지브리 밈이 인기를 끌면서 ChatGPT 사용량이 급증했고, OpenAI CEO 샘 알트만에 따르면 회사의 GPU가 ‘녹을 지경’이었다고 한다. 

경쟁이 치열해지면서 메타는 지난주 스타트업 미드저니(Midjourney)의 AI 이미지 모델 라이선스를 취득한다고 발표했고, a16z가 투자한 독일 유니콘 기업 블랙 포레스트 랩스(Black Forest Labs)는 FLUX AI 이미지 모델로 벤치마크를 계속 압도하고 있다.

구글의 인상적인 AI 이미지 편집기가 OpenAI와의 사용자 격차를 줄이는 데 도움이 될지 주목된다. ChatGPT는 현재 주간 사용자 7억 명 이상을 기록하고 있는 반면, 7월 구글 실적 발표에서 순다르 피차이 CEO는 제미나이가 월간 사용자 4억 5천만 명을 보유하고 있다고 밝혔는데, 이는 주간 사용자는 더 적다는 것을 의미한다.

브리히토바는 구글이 이 이미지 모델을 소비자 사용 사례를 염두에 두고 특별히 설계했다고 말했다. 사용자들이 집과 정원 프로젝트를 시각화하는 데 도움을 주는 것 등이 포함되며, 이 모델은 더 나은 “세계 지식”을 가지고 있어 단일 프롬프트에서 여러 참조를 결합할 수 있다. 예를 들어 소파, 거실 사진, 색상 팔레트 이미지를 하나의 일관된 렌더링으로 합칠 수 있다.

새로운 기능으로는 의상이나 위치 변경이 가능하다. 사진을 업로드하면 모델이 새로운 시나리오에 배치하면서도 동일한 외모를 유지해 다양한 의상이나 직업을 시도하거나 다른 시대의 모습을 볼 수 있다. 또한 여러 사진을 업로드해 새로운 장면으로 혼합할 수 있어, 자신의 사진과 개 사진을 농구장에서 함께 있는 완벽한 초상화로 만드는 것이 가능하다. 다중 턴 편집도 지원해 제미나이가 만든 이미지를 계속 편집할 수 있으며, 빈 방에서 시작해 벽을 칠하고 책장, 가구, 커피 테이블을 추가하면서 나머지는 보존하고 특정 부분만 변경할 수 있다. 디자인 믹싱 기능으로는 한 이미지의 스타일을 다른 이미지의 객체에 적용할 수 있어, 꽃잎의 색상과 질감을 장화에 적용하거나 나비 날개 패턴으로 드레스를 디자인하는 것도 가능하다.

패션 스타트업들이 온라인 경험을 강화하기 위해 다양한 기능을 내놓고 있는데, 아래 기능을 보면 아주 큰 영향을 받을 것으로 보인다. 

구글은 과거 AI 이미지 생성기 안전장치에서 어려움을 겪었다. 한때 제미나이가 역사적으로 부정확한 인물 사진을 생성한 것에 대해 사과하고 AI 이미지 생성기를 완전히 중단한 적이 있었다. 현재 구글은 더 나은 균형을 찾았다고 보고 있으며, 브리히토바는 “사용자에게 창조적 제어권을 주어 모델에서 원하는 것을 얻을 수 있게 하고 싶지만, 무엇이든 허용되는 것은 아니다”라고 말했다.

구글의 생성 AI 서비스 약관은 “비동의 친밀한 이미지” 생성을 금지한다. 하지만 그록은 테일러 스위프트 같은 유명인을 닮은 AI 생성 노골적 이미지를 사용자가 만들 수 있도록 허용했다는 점에서 이런 안전장치가 부족해 보인다. 딥페이크 이미지의 증가에 대응하기 위해 브리히토바는 구글이 AI 생성 이미지에 시각적 워터마크와 메타데이터 식별자를 적용한다고 말했다. 하지만 소셜미디어에서 이미지를 스크롤하는 사람들은 이런 식별자를 찾지 않을 수 있다고 인정했다.

이번 업데이트된 이미지 편집 기능은 오늘부터 제미나이 앱에서 사용할 수 있으며, 제미나이 앱에서 생성되거나 편집된 모든 이미지는 AI 생성임을 명확히 보여주는 보이는 워터마크와 보이지 않는 신스아이디(SynthID) 디지털 워터마크를 포함한다.

기사 공유하기

답글 남기기