오픈AI, 4배 빠른 이미지 생성 모델 ‘GPT Image 1.5’ 공개


오픈AI(OpenAI)가 챗GPT(ChatGPT)의 이미지 생성 기능을 대폭 개선한 새 모델 ‘GPT 이미지 1.5(GPT Image 1.5)’를 발표했다. 구글(Google)의 제미나이(Gemini) 3 프로와 나노 바나나 프로(Nano Banana Pro)가 시장 점유율을 확대하는 가운데 나온 반격이다.

GPT image 1.5 banner - 와우테일

새 모델은 기존보다 최대 4배 빠른 생성 속도를 자랑하며, 편집 일관성과 텍스트 렌더링 품질도 크게 향상됐다. 사용자가 이미지를 업로드한 후 특정 부분만 수정을 요청하면 조명, 구도, 얼굴 특징 등 핵심 요소는 그대로 유지하면서 요청한 부분만 정확하게 변경한다. 기존 생성형 AI 이미지 도구들이 “표정을 조정해줘”나 “조명을 차갑게 만들어줘” 같은 구체적인 요청을 받으면 전체 이미지를 재해석해 일관성이 떨어지던 문제를 해결했다.

오픈AI는 챗GPT의 모바일 앱과 웹사이트에 이미지 전용 섹션을 새로 추가했다. 수십 개의 사전 설정 필터와 프롬프트가 제공되며 최신 트렌드를 반영해 정기적으로 업데이트된다. 오픈AI의 애플리케이션 부문 CEO인 피지 시모(Fidji Simo)는 “만들고 있는 것을 보고 형성할 수 있어야 한다. 시각 자료가 단어만으로는 전달할 수 없는 이야기를 할 때 챗GPT가 이를 포함해야 한다”고 강조했다.

시모는 페이스북(Facebook) 앱 책임자와 인스타카트(Instacart) CEO를 거쳐 올해 8월 오픈AI에 합류했으며, 제품·사업·엔지니어링 부문을 총괄하고 있다. 업계는 그의 영입을 오픈AI가 구독료와 B2B 수익을 넘어 광고 사업으로 확장하려는 신호로 해석한다. 시모는 페이스북에서 10년간 근무하며 광고 플랫폼 개발을 주도했고, 인스타카트를 아마존(Amazon), 월마트(Walmart) 다음가는 소매 광고 사업으로 키워낸 인물이다.

GPT 이미지 1.5는 API로도 제공되며, 이미지 입출력 비용이 기존 대비 20% 저렴해졌다. 웹사이트 빌더 플랫폼 윅스(Wix)의 AI 연구 및 데이터 과학 책임자 힐라 가트(Hila Gat)는 “프롬프트 준수도가 높고 구도, 조명, 세부 사항을 정확하게 보존한다. 컨셉부터 제작까지의 워크플로우를 더 빠르게 만들어준다”고 평가했다. 특히 브랜드 로고와 핵심 비주얼을 편집 과정에서 일관되게 유지할 수 있어 마케팅과 이커머스 분야에서 유용하다.

YouTube 동영상

이번 업데이트는 구글과의 경쟁이 치열해지는 시점에 나왔다. 구글은 지난 11월 제미나이 3 프로와 나노 바나나 프로를 출시하며 스튜디오급 출력과 정밀한 텍스트 렌더링으로 주목받았다. 구글은 10월 제미나이 사용자가 7월 4억5000만명에서 6억5000만명으로 급증했다고 밝혔다. 나노 바나나 프로의 인기로 구글은 최근 무료 사용자에게 하루 2회 이미지 생성 제한을 적용하기도 했다.

오픈AI는 지난 주 GPT-5.2를 출시하며 전문가급 지식 작업을 위한 가장 강력한 모델이라고 소개한 바 있다. 챗GPT 엔터프라이즈 사용자들은 평균 하루 40~60분을 절약하고 있으며, 헤비 유저는 주당 10시간 이상을 절약한다. 새로운 이미지 모델은 이러한 생산성 향상을 시각적 작업 영역으로 확장하려는 전략이다.

오픈AI는 “이미지 생성이 가능하게 할 수 있는 것의 시작점에 있다”며 “앞으로 더 세밀한 편집, 다양한 언어에 걸친 더 풍부한 출력물이 나올 것”이라고 밝혔다. 새로운 챗GPT 이미지 모델은 현재 전 세계 모든 챗GPT 사용자와 API 사용자에게 제공되며, 이전 버전은 커스텀 GPT로 계속 이용할 수 있다.

기사 공유하기

답글 남기기