추론 칩 전쟁의 선두주자 세레브라스, 230억 달러 가치에 10억 달러 시리즈H 투자 유치


세레브라스 시스템즈(Cerebras Systems)가 2026년 2월 3일, 기업가치 약 230억 달러에 10억 달러 규모의 시리즈H 투자 유치를 공식 발표했다. 타이거 글로벌(Tiger Global)이 이번 라운드를 주도했으며, 벤치마크(Benchmark), 피델리티 매니지먼트 앤 리서치(Fidelity Management & Research Company), 아트레이즈 매니지먼트(Atreides Management), 알파 웨이브 글로벌(Alpha Wave Global), 알티미터(Altimeter), AMD, 코어투(Coatue), 1789 캐피탈(1789 Capital) 등이 참여했다.

celebras wse - 와우테일

불과 몇 달 전인 2025년 9월 시리즈G에서 81억 달러로 평가받았던 세레브라스의 기업가치가 이번에 230억 달러로 껑충 뛰었다. 약 세 배 가까이 오른 셈이다. 이는 AI 추론 인프라를 향한 투자 열기가 얼마나 뜨거운지를 단적으로 보여준다.

세레브라스의 급성장 배후에는 오픈AI(OpenAI)와의 대형 계약이 있다. 세레브라스는 올해 1월 오픈AI와 2028년까지 750메가와트 규모의 컴퓨팅 파워를 공급하는 10억 달러 이상 규모의 다년 계약을 체결했다. 챗GPT 사용자가 주간 9억 명을 돌파하면서 오픈AI가 엔비디아 의존도를 줄이고 컴퓨팅 인프라를 다각화하려는 전략의 일환이다. 세레브라스의 초저지연 추론 시스템은 코드 생성, 이미지 제작, AI 에이전트 실행처럼 응답 속도가 핵심인 워크로드에서 강점을 발휘한다.

웨이퍼 전체를 하나의 칩으로

세레브라스는 2015년 앤드류 펠드먼(Andrew Feldman), 게리 라우터백(Gary Lauterbach), 마이클 제임스(Michael James), 숀 라이(Sean Lie), 장 필리프 프리커(Jean-Philippe Fricker) 등 5인이 공동 창업했다. 창업팀은 이전에 함께 에너지 효율형 마이크로서버 회사 씨마이크로(SeaMicro)를 세워 2012년 AMD에 3억 3,400만 달러에 매각한 이력을 공유하고 있다.

CEO 펠드먼은 AI가 발전하려면 처리 속도가 근본적으로 달라져야 한다고 믿었다. 스탠퍼드대 경제학·정치학을 전공하고 스탠퍼드 비즈니스 스쿨 MBA를 마친 그는 AMD에서 기업부사장을 지낸 후, 새로운 도전을 모색하던 중 예전 동료들과 의기투합해 세레브라스를 세웠다.

세레브라스의 핵심은 웨이퍼 스케일 엔진(Wafer Scale Engine, WSE)이라는 독특한 아키텍처에 있다. 일반 반도체는 웨이퍼에서 작은 다이를 잘라내는 방식으로 제조하지만, 세레브라스는 TSMC 5nm 공정으로 만든 웨이퍼 전체를 하나의 칩으로 쓴다. 최신 3세대 모델인 WSE-3는 4조 개의 트랜지스터와 90만 개의 AI 최적화 코어를 단일 기판에 집약했다. 엔비디아 B200보다 트랜지스터는 19배, 컴퓨팅 성능은 28배 많다고 회사 측은 밝힌다. 온칩 SRAM 44GB를 탑재했고, 메모리 대역폭은 엔비디아 H100 대비 7,000배에 달한다.

이 구조가 추론 속도에서 결정적인 차이를 만든다. 수천 개의 GPU를 연결한 기존 클러스터는 칩 간 데이터 이동이 병목이 되는 반면, 세레브라스는 모델 파라미터를 온칩 메모리 안에 담아 외부 메모리 접근 없이 연산한다. 실제로 세레브라스의 추론 서비스는 라마(Llama) 계열 모델에서 초당 1,000토큰 이상의 생성 속도를 기록했으며, 오픈AI가 최근 공개한 GPT-5.3 코드엑스 스파크(Codex-Spark)는 세레브라스 인프라 위에서 초당 약 1,000토큰으로 구동된다.

추론 칩 전쟁의 한복판에서

세레브라스가 이번 투자를 유치한 맥락을 이해하려면 AI 반도체 시장의 판도 변화를 살펴봐야 한다. 와우테일이 지난 1월 보도한 2025 AI 반도체 시장 분석에서 짚었듯, 추론 칩 시장은 이제 AI 인프라 경쟁의 새로운 전장이다.

훈련은 한 번으로 끝나지만 추론은 사용자의 모든 질의마다 반복된다. 챗GPT 같은 서비스의 추론 클러스터는 훈련 클러스터보다 10배 이상 크다는 사실이 이를 방증한다. 전문가들은 2030년까지 데이터센터 수요의 70%가 AI 추론에서 나올 것으로 전망한다. 추론 칩 시장은 2023년 158억 달러에서 2030년 906억 달러로 성장할 것으로 예상되며, 연평균 성장률은 22.6%에 달한다.

이 시장에서 세레브라스의 주요 경쟁 상대는 추론 전문 칩 메이커들이다. 그로크(Groq)는 LPU(Language Processing Unit) 아키텍처로 초당 수백 토큰의 생성 속도를 자랑하며 69억 달러 기업가치로 7억 5,000만 달러를 유치했으나, 2025년 12월 엔비디아가 200억 달러 규모의 기술 라이선스 계약을 체결하며 사실상 인수에 가까운 형태로 편입됐다. 삼바노바(SambaNova)는 RDU(Reconfigurable Dataflow Unit) 아키텍처를 앞세워 추론 속도 경쟁에 참여해왔으나, 인텔이 약 16억 달러 규모 인수를 협상 중인 것으로 알려졌다. 트랜스포머 전용 ASIC을 개발하는 에치드(Etched)는 최근 50억 달러 가치에 5억 달러를 유치하며 존재감을 높이고 있다. 구글 TPU 출신들이 세운 맷엑스(MatX)는 LLM 전용 칩으로 5억 달러 시리즈B를 최근 마쳤다.

엔비디아는 이 흐름에 촉각을 곤두세우고 있다. GPU는 여전히 학습 시장의 절대 강자지만, 추론 워크로드에서는 지연시간과 에너지 효율이 원시 성능보다 더 중요한 평가 기준이 된다. 추론에 최적화된 전용 아키텍처가 GPU보다 유리하다는 사실이 시장에서 점점 입증되고 있는 것이다.

IPO 향해 달려가는 세레브라스

세레브라스는 2024년 10월 나스닥 상장을 추진하다가 철회했다. 당시 사우디아라비아 국부펀드와 연계된 주요 고객 G42의 매출 비중이 지나치게 높다는 점이 발목을 잡았다. 이후 오픈AI와 대형 계약을 맺으면서 고객 다각화에 성공했고, 시리즈H까지 마친 세레브라스는 이르면 2026년 2분기 IPO를 목표로 상장 준비를 다시 진행 중이다.

펠드먼 CEO는 이번 자금으로 “제조 역량을 대폭 늘리고, 전 세계에 더 많은 데이터센터를 열고, 뛰어난 엔지니어링 아이디어를 계속 추구할 것”이라고 밝혔다. 그는 AI 산업이 훈련 중심에서 추론 중심으로 넘어가는 변곡점에 있다고 진단하면서, “추론 시간 컴퓨팅, 즉 추가적인 토큰 사용을 통해 답변 품질을 높이는 것이 극도로 강력한 도구가 되고 있다”고 강조했다.

세레브라스가 8차례 라운드에 걸쳐 누적 조달한 금액은 총 약 25억 5,000만 달러에 달한다. IPO 성공 여부는 이제 기술력보다 소프트웨어 생태계와 비용 경쟁력에 달려 있다는 시각이 많다. 세레브라스는 오픈AI의 챗 컴플리션 API와 호환되는 추론 API를 제공해 개발자들의 마이그레이션 장벽을 낮추고 있으며, 엔비디아 블랙웰 대비 동일 추론 워크로드 기준 운영 비용이 32% 낮다고 주장한다.

추론 칩 전쟁의 선두에 선 세레브라스가 IPO라는 다음 고지를 어떻게 넘을지 주목된다.

기사 공유하기

답글 남기기