오픈AI, 최고 정밀도 ‘GPT-5 프로’와 오디오 동기화 ‘소라2’ API 공개


오픈AI(OpenAI)가 최신 AI 모델인 GPT-5 프로(GPT-5 Pro)와 차세대 동영상 생성 AI 소라2(Sora 2)를 지난 6일 DevDay 2025에서 공개했다. 두 모델 모두 API를 통해 개발자에게 즉시 제공되며, 각각 정밀도와 멀티미디어 생성 능력에서 새로운 기준을 제시한다.

DevDay 2025 GPT 5 Pro in the API - 와우테일

GPT-5 프로: 정밀도가 중요한 작업의 최강자

샘 올트먼 최고경영자는 GPT-5 프로를 “API에서 정밀도가 중요한 작업을 위한 가장 스마트한 모델”이라고 소개했다. GPT-5 프로는 기존 모델 대비 더 빠른 추론, 풍부한 컨텍스트 이해, 개인화된 고성능 사용자 경험을 제공한다. 올트먼은 “코드 리팩토링과 코드 리뷰 같은 작업에서 탁월하며, 작업 복잡도에 따라 사고 시간을 조절할 수 있다”고 설명했다.

가격 측면에서 GPT-5 프로는 입력 100만 토큰당 15달러, 출력 100만 토큰당 120달러로 책정됐다. 이는 기존 o1-프로 모델(입력 150달러, 출력 600달러)보다 훨씬 저렴하면서도 더 높은 정밀도를 제공한다. 오픈AI는 플랫폼에서 매주 수백만 건의 평가를 실행할 수 있는 환경을 구축했으며, 이를 통해 GPT-5 프로의 성능을 지속적으로 개선하고 있다.

올트먼은 “오픈AI에서 작성되는 거의 모든 새로운 코드가 코덱스(Codex) 사용자에 의해 작성된다”며 “코덱스를 사용하는 엔지니어는 주당 70% 더 많은 풀 리퀘스트를 완료하고, 거의 모든 오픈AI PR이 코덱스 리뷰를 거친다”고 밝혔다. 이는 GPT-5 프로의 실제 생산성 향상 효과를 입증하는 사례다.

gpt-realtime-mini: 70% 저렴한 실시간 음성 모델

오픈AI는 GPT-5 프로와 함께 실시간 음성 모델인 gpt-realtime-mini도 공개했다. 이 모델은 대형 음성 모델보다 70% 저렴하면서도 저지연 음성 대화 경험을 제공한다. 실시간 음성 상호작용이 필요한 고객 서비스, 교육, 엔터테인먼트 애플리케이션에 최적화됐다.

Devday 2025 Sora 2 in the API - 와우테일

소라2: 오디오 동기화된 차세대 동영상 AI

소라2(Sora 2)는 오픈AI의 동영상 생성 AI 소라의 2세대 버전이다. 올트먼은 “소라2가 이제 API에 들어왔으며, 새로운 개발자 소프트웨어를 개발자들이 테스트할 수 있다”고 발표했다. 소라2의 가장 큰 개선점은 현실적인 사운드스케이프와 동기화된 오디오를 추가한 것이다.

올트먼은 무대에서 해변에서 뛰노는 강아지들과 급류를 타는 카약 선수의 AI 생성 영상을 시연했다. 이 영상들은 단순히 시각적 요소만이 아니라 물소리, 개 짖는 소리 등 현실감 있는 오디오가 동기화돼 있었다. 개발자는 소라2를 활용해 교육 콘텐츠, 이커머스 제품 홍보, 장난감 디자인 등 다양한 분야에서 풍부한 멀티미디어 콘텐츠를 생성할 수 있다.

DevDay 행사장에는 ‘소라 시네마(Sora Cinema)’라는 특별 공간이 마련됐다. 팝콘이 제공되는 아늑한 미니 극장에서 소라로 제작된 단편 영화를 상영했다. 이는 소라2가 단순한 데모 단계를 넘어 실제 창작 도구로 활용될 수 있음을 보여주는 체험형 전시였다.

소라2는 9월 30일 앱 스토어에서 1위를 차지하며 대중적 관심을 입증했다. 다만 맥도날드(McDonald’s)와 스폰지밥(SpongeBob SquarePants) 같은 브랜드의 로고와 캐릭터를 생성할 수 있어 저작권 논란에 직면해 있다. 오픈AI는 이러한 문제를 해결하기 위해 콘텐츠 필터링과 안전성 가드레일을 강화하고 있다.

업계 전문가들은 소라2가 크리에이티브 전문가에게 엄청난 잠재력을 제공한다고 평가한다. 영화 제작, 교육 콘텐츠, 마케팅 자료 개발 등에서 복잡한 창작 작업을 간소화하고, 전문가가 비전과 아이디어에 집중할 수 있게 한다. DevDay 키노트에서 선보인 시연은 교육, 이커머스, 장난감 디자인 분야의 활용 사례를 보여줬다.

엔터프라이즈 기능 강화

오픈AI는 기업 고객을 위한 새로운 제어 기능도 발표했다. 데이터 보존 정책, 학습 비활성화 토글, 테넌시 격리, 감사 추적, 프라이빗 네트워크 및 VPC 지원 등이 포함된다. 이는 규정 준수 요구사항을 충족하기 위한 것으로, 엔터프라이즈 고객의 채택을 가속화할 것으로 예상된다.

올트먼은 기자들과의 질의응답에서 수익 창출과 수익성 달성이 “현재 최우선 과제 10개 안에 들지 않는다”고 밝혔다. 그는 “결국 수익성을 달성해야 하겠지만, 지금은 투자와 성장의 시기”라며 “우리는 매우 수익성 높은 모델을 구축할 수 있다고 확신한다”고 말했다. 이는 오픈AI가 당분간 시장 점유율 확대와 제품 혁신에 집중하겠다는 의지를 보여준다.

오픈 가중치 모델 로드맵

오픈AI는 2025년 초 오픈 가중치 추론 모델을 출시하겠다고 약속했다. 이는 개발자에게 파라미터 접근 권한을 제공해 파인튜닝을 가능하게 하는 조치로, 더 개방적인 AI 생태계를 향한 움직임이다. 다만 초기 ‘오퍼레이터(Operator)’ 에이전트(브라우저 자동화)는 더 일반적인 에이전트킷 접근 방식으로 대체되며 단계적으로 폐지될 예정이다.

DevOps와 조달 팀을 위해 오픈AI는 토큰 가격, 동시성 제한, SLO(서비스 수준 목표), 성능 벤치마크를 포함한 상세한 가격 및 성능 정보를 공개했다. 이는 엔터프라이즈 채택을 형성할 핵심 요소다.

GPT-5 프로와 소라2의 출시는 오픈AI가 단순히 강력한 모델을 만드는 것을 넘어, 개발자와 기업이 실제로 활용할 수 있는 실용적인 도구를 제공하는 데 집중하고 있음을 보여준다. 올트먼은 “우리는 중요한 일이 일어나는 것을 목격하고 있다”며 “소프트웨어를 구축하는 데 수개월이나 수년이 걸렸지만, 이제는 AI와 함께 몇 분 만에 만들 수 있다”고 강조했다.

오픈AI의 API 사용량은 폭발적으로 증가하고 있다. 2023년 분당 3억 개의 토큰을 처리하던 것이 현재는 60억 개로 20배 증가했다. 이러한 성장세는 GPT-5 프로와 소라2 같은 고성능 모델의 출시로 더욱 가속화될 전망이다.

DevDay 2025에서 발표한 내용은 아래를 참고하시길.

기사 공유하기

답글 남기기