엔비디아 전력 3분의 1로 같은 성능…포지트론 AI, 2.3억 달러 투자로 유니콘 등극


네바다주 리노 기반의 AI 추론 칩 스타트업 포지트론 AI(Positron AI) 2.3억 달러 규모의 시리즈 B 투자를 유치했다고 2월 4일 밝혔다. 이번 투자로 포지트론의 기업가치는 10억 달러를 돌파하며 유니콘 클럽에 합류했다. 아레나 프라이빗 웰스(ARENA Private Wealth), 점프 트레이딩(Jump Trading), 언레스(Unless)가 공동으로 투자를 주도했고, 카타르투자청(Qatar Investment Authority), 암(Arm), 헬레나(Helena)가 신규 전략 투자자로 참여했다. 기존 투자자인 발러 이퀴티 파트너스(Valor Equity Partners), 아트레이데스 매니지먼트(Atreides Management), DFJ 그로스(DFJ Growth), 레질리언스 리저브(Resilience Reserve), 플룸 벤처스(Flume Ventures), 1517 펀드도 함께했다.

Positron AI founders - 와우테일

이번 투자로 포지트론의 누적 조달액은 3억 달러를 넘어섰다. 창업 3년차인 회사는 지난해 6월 7,500만 달러 규모의 시리즈 A를 유치한 바 있다. 엔비디아가 AI 칩 시장을 장악한 가운데, 대형 클라우드 사업자와 AI 기업들이 공급망을 다변화하려는 움직임을 보이면서 포지트론 같은 대안 업체에 투자금이 몰리고 있다. 실제로 오픈AI는 엔비디아의 최신 칩에 대한 불만을 표시하며 지난해부터 다른 업체를 알아보고 있다고 로이터가 보도했다.

포지트론 CEO 미테시 아그라왈(Mitesh Agrawal)은 “에너지 공급이 AI 배포의 핵심 병목으로 떠올랐다”며 “이번 투자자들의 뜨거운 반응은 시장이 원하는 게 무엇인지 보여준다”고 말했다. 아그라왈은 AI 클라우드 컴퓨팅 업체 람다(Lambda)에서 COO로 일하며 회사 매출을 50만 달러에서 5억 달러까지 끌어올린 인물이다. 그는 올해 2월 초 포지트론 CEO로 합류하며 “딥시크(DeepSeek)의 성공은 추론 시점 연산이 AI 모델에 실질적 성과를 가져다주는 새로운 확장 요소임을 입증했다”고 강조했다.

포지트론의 공동창업자이자 CTO인 토마스 솜머스(Thomas Sohmers)는 실리콘밸리 반도체 업계에서 주목받는 인물이다. 2013년 피터 틸 펠로우십을 받은 그는 17세에 첫 프로세서 회사 REX 컴퓨팅을 창업했고, 이후 람다에서 수석 하드웨어 아키텍트로 GPU 클라우드를 구축했다. 그로크(Groq)에서 기술 전략 디렉터로 근무한 뒤 2023년 봄 포지트론을 세웠다.

포지트론의 첫 제품 아틀라스(Atlas)는 애리조나에서 제조되는 추론 시스템으로, 엔비디아 H100 GPU와 비슷한 성능을 3분의 1 전력으로 낸다는 게 회사 측 설명이다. 포지트론은 대규모 언어모델을 훈련하는 게 아니라 실제 애플리케이션에서 AI 모델을 돌리는 데 필요한 연산, 즉 추론에 집중한다. 기업들이 거대 모델을 만드는 것보다 이를 실제로 배포하는 데 관심을 돌리면서 추론 하드웨어 수요가 치솟고 있다.

포지트론이 전력 소모를 획기적으로 줄인 비결은 ‘메모리 우선 설계’에 있다. 일반적인 GPU는 연산 성능(FLOPS)을 최대화하는 데 집중한 뒤 메모리를 나중에 붙이는 방식이다. 하지만 챗GPT 같은 대규모 언어모델을 실제로 돌릴 때는 복잡한 계산보다 데이터를 메모리에서 얼마나 빨리 읽고 쓰느냐가 성능을 좌우한다. GPU가 아무리 빠르게 계산해도 메모리에서 데이터를 가져오는 속도가 느리면 칩은 쉬게 되고, 이때도 전력은 계속 소모된다.

포지트론은 이 문제를 정반대 방식으로 접근했다. 메모리 대역폭과 용량을 먼저 설계하고, 연산 능력을 여기에 맞춰 균형있게 배치했다. 그 결과 아틀라스는 실제 트랜스포머 모델을 돌릴 때 메모리 대역폭을 93%까지 활용한다. GPU가 보통 10~30%밖에 쓰지 못하는 것과 비교하면 압도적이다. 쉽게 말하면 택배 트럭(메모리)과 하역 인력(연산 칩)의 균형을 맞춰서, 트럭이 도착하면 바로 짐을 내리고 다시 보낼 수 있게 만든 것이다. GPU는 하역 인력은 많지만 트럭이 늦게 와서 대부분의 시간을 놀게 된다.

또 다른 핵심은 데이터 이동을 최소화한 것이다. 칩 안에서 데이터를 옮기는 게 전력 소모와 지연의 가장 큰 원인이다. 포지트론은 512×128 크기의 시스톨릭 어레이(규칙적으로 데이터가 흐르는 계산 구조)를 사용하고, 각 계산 유닛 바로 옆에 메모리를 배치했다. 데이터가 칩 이곳저곳을 돌아다니지 않고 제자리에서 바로 처리된다. 점프 트레이딩의 CTO 알렉스 데이비스(Alex Davies)는 “우리가 신경 쓰는 작업에서 병목은 이론적 연산 능력이 아니라 점점 더 메모리와 전력”이라며 “테스트 결과 포지트론 아틀라스는 비슷한 H100 시스템보다 지연시간이 3배 낮았고, 공랭식으로 작동했다”고 말했다.

이번 투자금은 차세대 커스텀 실리콘 칩 아시모프(Asimov) 개발에 쓰인다. 아시모프는 요즘 AI 작업이 단순 연산 성능(flop)보다는 메모리 대역폭과 용량에 좌우된다는 점을 반영해 설계됐다. 가속기당 2테라바이트 메모리, 타이탄(Titan) 시스템당 8테라바이트 메모리를 지원하며, 메모리 대역폭은 엔비디아의 차세대 루빈(Rubin) GPU와 비슷한 수준을 목표로 한다. 랙 단위로는 100테라바이트 이상의 메모리를 확보한다.

positron logo - 와우테일

특히 아시모프는 값비싼 고대역폭 메모리(HBM) 대신 LPDDR5x라는 일반 메모리를 쓴다는 점이 독특하다. HBM은 이론상 대역폭은 높지만 가격이 비싸고 전력을 많이 먹으며 공급도 불안정하다. 포지트론은 메모리를 93%까지 효율적으로 쓰는 기술 덕분에 일반 메모리로도 HBM과 비슷한 실제 성능을 낼 수 있다. 게다가 같은 가격으로 HBM보다 6배 많은 용량을 확보할 수 있다. 아시모프는 엔비디아 루빈이 384GB 메모리를 탑재하는 것과 달리 2,304GB를 실을 예정이다. 포지트론은 크레도 세미컨덕터(Credo Semiconductor)와 공동 개발한 위버(Weaver) 메모리 팬아웃 칩렛을 써서 일반 메모리와 칩을 고속으로 연결한다.

이런 메모리 중심 구조는 긴 문맥을 다루는 대규모 언어모델, 에이전트 워크플로우, 차세대 비디오 생성처럼 가치 높은 추론 작업을 가능하게 만든다. 암의 클라우드 AI 사업부 부사장 에디 라미레즈(Eddie Ramirez)는 “AI 추론이 확장될수록 효율성과 시스템 설계가 단순 벤치마크보다 중요해진다”며 “암 기술 위에 구축된 포지트론의 메모리 중심 접근법은 긴밀한 시스템과 폭넓은 생태계가 차세대 AI 인프라에서 확장 가능한 와트당 성능을 어떻게 끌어올리는지 보여준다”고 평가했다.

포지트론은 지난 6월 시리즈 A 투자 이후 16개월 만에 아시모프 칩의 테이프아웃(설계 완료)을 마칠 예정이며, 2027년 초 양산을 목표로 한다. 아그라왈 CEO는 “엔비디아와 경쟁한다는 건 그들의 출시 속도를 맞춰야 한다는 뜻”이라며 “우리는 이 목표를 중심으로 조직을 짰고, 개발 속도를 핵심 경쟁력으로 본다”고 강조했다.

AI 추론 칩 시장에선 경쟁이 치열하다. 세레브라스(Cerebras)는 지난해 11억 달러를 투자받아 기업가치 81억 달러로 평가받았고 IPO를 준비 중이다. 그로크(Groq)7.5억 달러를 유치해 기업가치 69억 달러에 도달했으나, 엔비디아가 지난해 12월 200억 달러 규모의 라이선스 계약으로 그로크의 기술과 핵심 인력을 확보했다. 마이크로소프트가 지원하는 D-매트릭스(D-Matrix)는 지난 12월 2.75억 달러를 투자받아 기업가치 20억 달러를 기록했다.

이번 투자에서 카타르투자청의 참여가 눈길을 끈다. 중동 국가들이 AI 인프라를 전략적 주권 문제로 보기 시작했다는 신호다. 카타르는 지난해 9월 브룩필드 에셋 매니지먼트(Brookfield Asset Management)와 200억 달러 규모의 AI 인프라 합작투자를 발표했다. 아시모프 칩은 애리조나에서 만들어질 예정인데, 이는 미국의 CHIPS법에 따라 자국 반도체 생산 능력을 되살리려는 움직임과도 맞닿아 있다.

포지트론의 공동 투자 주도사인 아레나 프라이빗 웰스의 대체투자 총괄 아리 쇼텐슈타인(Ari Schottenstein)은 “포지트론은 AI의 가장 중요한 병목인 실제 전력과 비용 제약 안에서 대규모 추론을 제공하는 문제를 풀고 있다”며 “지금 아틀라스로 제품을 출하하면서도 아시모프로 가는 길이 명확하다는 점이 AI 인프라에서 새 카테고리를 만들 드문 기회”라고 평가했다. 포지트론은 암, 슈퍼마이크로(Supermicro) 같은 주요 기술 및 공급망 파트너들과 이 플랫폼을 함께 만들고 있다.

기사 공유하기

답글 남기기