포에틱, 기업 AI 추론 능력 향상 솔루션으로 4,580만 달러 시드 투자 유치


구글 딥마인드에서 10년 넘게 함께 일한 연구진이 만든 AI 스타트업 포에틱(Poetiq)이 4,580만 달러 규모의 시드 투자를 유치했다. 투자는 FYRFLY 벤처 파트너스(FYRFLY Venture Partners)와 서피스 벤처스(Surface Ventures)가 공동 주도했으며, 와이컴비네이터(Y Combinator), 468 캐피털(468 Capital), 오퍼레이터 콜렉티브(Operator Collective), 히코 벤처스(Hico Ventures), 뉴런 벤처 파트너스(Neuron Venture Partners)가 참여했다.

poetiq logo - 와우테일

포에틱은 2025년 6월 슈미트 발루자(Shumeet Baluja)와 이안 피셔(Ian Fischer)가 공동 설립했다. 발루자는 구글 딥마인드에서 21년간 일하며 모바일 사업부를 처음 만들었고, 컴퓨터 비전 기초 연구 그룹도 세웠다. 유튜브 저작권 시스템을 설계한 핵심 인물이기도 하며, 신경망과 머신러닝 분야에서 170개 넘는 특허를 보유하고 있다. 피셔는 iOS 게임을 안드로이드로 옮겨주는 플랫폼 어포터블(Apportable)을 공동 창업하고 최고기술책임자(CTO)로 일하다가, 2015년 구글이 이 회사를 인수하면서 딥마인드에 합류했다. 두 사람은 딥마인드에서 함께 일하며 최신 대규모언어모델(LLM)조차 복잡한 문제 해결에 여전히 한계가 있다는 걸 깨달았고, 이 문제를 해결하기 위해 포에틱을 세웠다.

포에틱의 핵심은 기존 LLM을 훨씬 더 똑똑하게 만드는 메타시스템이다. 보통 LLM 성능을 높이려면 강화학습을 통한 사전학습과 후속학습이 필요하다. 문제는 이 과정에 수백만 개의 데이터와 수주간의 시간, 엄청난 비용이 든다는 점이다. 포에틱은 이를 몇백 개의 예시만으로, 단 몇 시간 만에 끝낼 수 있는 ‘재귀적 자기개선(recursive self-improvement)’ 방식을 만들어냈다.

이 방식을 쉽게 설명하면 이렇다. 학생이 수학 문제를 푸는 과정을 생각해보자. 처음엔 문제를 틀릴 수 있지만, 어떤 부분에서 틀렸는지 피드백을 받고 다시 풀어본다. 그 과정을 반복하면서 점점 더 나은 풀이법을 찾아가는 것이다. 포에틱의 시스템도 마찬가지다. 고객이 해결하고 싶은 문제와 몇백 개의 예시를 주면, 포에틱은 우선 그 문제에 특화된 AI 에이전트를 만든다. 이 에이전트가 문제를 풀어보고, 결과를 평가하고, 그 평가를 바탕으로 자신의 접근법을 스스로 개선한다. 이런 과정을 계속 반복하면서 점점 더 정확하고 효율적으로 문제를 해결하게 되는 방식이다. 특히 복잡한 문제의 경우, 포에틱의 시스템이 여러 개의 질문을 던지면서 문제를 더 잘 이해하고, 그에 따라 답을 개선해 나간다.

포에틱의 기술력은 ARC-AGI-2 벤치마크에서 입증됐다. ARC-AGI는 2019년 AI 연구자 프랑수아 숄레(François Chollet)가 개발한 벤치마크로, AI의 ‘인간과 유사한 일반화’ 능력을 측정한다. 1,000개의 시각적 퍼즐로 구성된 이 벤치마크는 AI 추론 능력을 테스트하는 가장 까다로운 도구 중 하나로 평가받는다. 포에틱은 12월 초 ARC-AGI-2 준비밀 평가 세트(semi-private evaluation set)에서 최고 점수를 기록했으며, 이전 1위였던 구글의 제미나이 3 딥씽크(Gemini 3 Deep Think)를 절반의 비용으로 앞질렀다. 며칠 후 오픈AI가 GPT-5.2를 출시하자 포에틱은 즉시 이 모델을 시스템에 통합해 공개 평가 세트에서 75%의 정확도로 새로운 최고 기록을 세웠다. 이는 이전 최고 점수보다 16%포인트나 높은 수치다.

Poetiq results on ARC AGI 2 Public Evaluation Set - 와우테일
Poetiq results on ARC-AGI-2 Public Evaluation Set (December 23, 2025)

중요한 것은 포에틱이 단 6명의 팀으로, 하드웨어 비용 4만 달러만으로 이 성과를 달성했다는 점이다. 구글, 앤트로픽(Anthropic) 같은 거대 AI 기업들을 제치고 ARC-AGI-2 1위를 차지한 것은 메타시스템 접근법의 효율성을 보여준다. 오픈AI 공동창업자 겸 사장인 그렉 브록맨(Greg Brockman)은 트위터를 통해 포에틱이 “GPT-5.2로 ARC-AGI-2에서 인간 기준을 초과했다”며 이 성과를 인정했다.

포에틱의 메타시스템은 오픈AI의 챗GPT, 앤트로픽의 클로드, 구글의 제미나이, 메타의 라마 등 모든 주요 LLM과 결합할 수 있다. 특정 모델에 종속되지 않고 어떤 LLM이든 더 빠르게 학습하고 어려운 문제를 더 잘 풀도록 만든다는 얘기다. 쉽게 말해, 기업이 이미 사용 중인 AI를 버리지 않고 그 위에 포에틱을 올려 훨씬 더 똑똑하게 만드는 방식이다.

포에틱이 주목받는 이유는 기업들의 AI 도입 실패율이 너무 높기 때문이다. MIT가 2025년 8월 발표한 300개 공공 AI 구현 사례 연구에 따르면, 기업들이 생성형AI에 300억~400억 달러를 쏟아부었지만 95%의 조직이 투자 대비 수익이 제로에 가깝다. 왜 그럴까? LLM이 간단한 질문엔 잘 답하지만, 실제 비즈니스 현장의 복잡한 문제를 정확하게 풀지 못하기 때문이다.

바로 이 지점이 포에틱의 타깃이다. 포에틱은 독점 사내 모델을 포함한 모든 LLM의 추론 능력을 끌어올려, 보험 청구 심사에서 어떤 건을 승인하고 거절할지, 금융 거래에서 어떤 패턴이 사기인지, 고객 문의에 어떻게 정확히 답할지 같은 복잡한 판단을 할 수 있게 만든다. 기업 입장에선 AI를 처음부터 다시 구축할 필요 없이, 이미 투자한 시스템의 성공 확률을 획기적으로 높이는 셈이다.

발루자 공동 대표는 “LLM은 인류의 집단 지식을 방대하게 담고 있는 인상적인 데이터베이스지만, 깊은 추론을 위한 최고의 도구는 아니다”라며 “우리는 재귀적 자기개선으로 단 몇 시간 만에 특화된 에이전트를 만들어냈다. LLM만으로는 너무 어렵거나 비용이 많이 드는 문제를 해결하는 데 얼마나 도움이 되는지 보여준 것”이라고 설명했다.

FYRFLY 벤처 파트너스의 필립 스타우퍼 제너럴 파트너는 “창업 6개월 만에 ARC-AGI 정상에 오른 것은 정말 놀랍다”며 “최신 모델과 경쟁하는 대신, 모든 LLM에서 더 많은 지능을 끌어내는 방법을 찾았다. 실제 비즈니스에 AI를 적용하려는 기업들에게 포에틱은 필수가 될 것”이라고 평가했다. 서피스 벤처스의 기안 카푸르 공동 매니징 파트너는 “포에틱은 최신 모델과 경쟁하거나 어느 한쪽 편을 들 필요가 없는 드문 AI 스타트업”이라며 “어떤 LLM 조합이든, 어떤 AI 사용 사례든 향상시킬 수 있다. 기초 모델 위에 올라가 더 나은 성능을 더 낮은 비용으로 제공하는 독특한 위치에 있다”고 설명했다.

포에틱의 경쟁사로는 기존 LLM을 더 강력하게 만드는 플랫폼을 제공하는 AI21 랩스(AI21 Labs)가 있다. AI21은 2017년 모빌아이(Mobileye) 공동창업자 암논 샤슈아(Amnon Shashua), 스탠퍼드대 교수 요아브 쇼함(Yoav Shoham), 기업가 오리 고센(Ori Goshen)이 설립한 이스라엘 AI 스타트업이다. AI21은 자체 대규모언어모델(쥬라기-1, 잠바 등)을 개발하며, 특히 신뢰할 수 있고 설명 가능한 기업용 AI에 주력해왔다.

AI21은 2019년 950만 달러 시드 투자를 시작으로, 2021년 2,000만 달러와 2,500만 달러, 2022년 6,400만 달러 시리즈B를 거쳐, 2023년 8월 1억 5,500만 달러 시리즈C 투자를 유치해 기업가치 14억 달러를 인정받았다. 시리즈C에는 구글(Google)과 엔비디아(Nvidia)가 참여했다. 2023년 11월에는 시리즈C를 확장해 추가로 5,300만 달러를 유치했으며, 여기에 인텔 캐피털(Intel Capital)과 컴캐스트 벤처스(Comcast Ventures)가 참여했다. 이로써 시리즈C 총액은 2억 800만 달러에 달했다. 2025년 5월에는 엔비디아와 구글이 주도하는 3억 달러 규모의 시리즈D 투자가 보도됐지만, 이 라운드는 실제로 완료되지 않은 것으로 밝혀졌다. 현재까지 AI21의 실제 투자 유치액은 약 2억 8,300만 달러다.

AI21의 주력 제품인 마에스트로(Maestro)는 GPT-4o나 클로드 3.5 소네트 같은 LLM의 정확도를 최대 50% 높이는 AI 계획 및 조율 시스템이다. 하지만 AI21의 연 매출은 약 5,000만 달러 수준으로, 2023년 이후 큰 변화가 없다. 직원 수도 2023년 260명에서 2026년 초 약 200명으로 줄었다. 최근 AI21은 엔비디아와 최대 30억 달러 규모의 인수 협상을 진행 중인 것으로 보도됐다. 이는 주로 AI21의 고급 학위를 가진 AI 연구 인력을 확보하기 위한 ‘애크하이어(acquihire)’ 성격으로 해석된다. 이런 움직임은 LLM 성능 향상 솔루션 시장이 빠르게 성장하고 있음을 보여준다.

포에틱은 이번 투자금으로 AI 제품팀과 연구진을 늘리고 더 많은 벤치마크에서 기술을 검증할 계획이다. 회사는 “몇 달 안에 무료로 제공할 만큼 빠르게 작동한다”며 재귀적 자기개선 기술의 효율성을 강조했다. 이를 통해 기업들이 매일 마주하는 실제 문제와 워크플로를 해결하는 믿을 수 있는 추론 시스템을 만들 수 있을 것으로 기대된다.

기사 공유하기

답글 남기기