AI 클러스터 네트워크를 ‘생각하는 네트워크’로…아리아 네트웍스, 1억 2500만 달러 유치


AI 팩토리의 진짜 병목은 GPU가 아닐 수 있다. GPU 수만 개가 쉬지 않고 돌더라도, 이들을 연결하는 네트워크가 제 역할을 못하면 가장 비싼 칩도 제 성능을 낼 수 없다. 학습 중 불량 NIC 하나만 생겨도 1만 개짜리 클러스터 전체의 모델 플롭 활용률(MFU)이 1.7%나 떨어진다. 불량 트랜시버 하나가 트래픽 우회를 연쇄적으로 유발하고, 처음부터 제대로 튜닝되지 않은 혼잡 설정이 지속적인 성능 저하를 일으킨다. 이 문제를 해결하기 위해 설립된 아리아 네트웍스(Aria Networks)가 1억 2500만 달러 규모의 시리즈 A 투자를 유치했다고 발표했다.

Aria Networks 1 - 와우테일

아리아 네트웍스가 공략하는 지점은 AI 클러스터 네트워킹 중에서도 ‘스케일아웃(scale-out)’ 레이어다. 스케일아웃은 여러 랙을 서로 연결하는 구간으로, 이더넷 스위치가 핵심 장비다. 랙 안에서 소수의 GPU를 초고속으로 묶는 스케일업과는 달리, 스케일아웃은 수천에서 수만 개의 가속기가 하나의 클러스터처럼 움직일 수 있게 하는 인프라다. 학습과 추론 모두에서 규모가 커질수록 이 구간의 품질이 전체 토큰 처리 효율을 직접 결정한다. 아리아는 기존 네트워킹이 단순히 패킷을 옮기는 데 그쳤다면, 네트워크 스스로가 클러스터 상태를 파악하고 최적화하는 ‘딥 네트워킹(Deep Networking)’을 내세운다.

회사가 직접 제시하는 수치가 이 문제의 규모를 잘 보여준다. MFU가 3% 개선되면 1만 개 가속기 클러스터에서 연간 약 4,980만 달러의 추가 수익이 발생한다는 계산이다. 아리아의 자체 추정이지만, 네트워크 최적화가 단순한 운영 문제가 아니라 비즈니스 핵심 변수임을 보여준다. 클러스터 비용에서 네트워크가 차지하는 비중은 10~15%에 불과하지만, 그 영향력은 전체 투자 회수율을 좌우할 만큼 크다.

만수르 카람(Mansour Karam) CEO는 연쇄 창업가다. 스탠퍼드 대학교 전기공학 박사 출신으로 25년 넘게 네트워킹 업계에 몸담았다. 아리스타 네트웍스(Arista Networks)의 첫 번째 비즈니스 리더로 초기 고객을 개척했고, SDN 스타트업 빅스위치 네트웍스(Big Switch Networks) 임원을 거쳐 2014년 의도 기반 네트워킹 회사 압스트라(Apstra)를 창업했다. 압스트라는 2020년 주니퍼 네트웍스(Juniper Networks)에 약 1억 9000만 달러에 인수됐고, 카람은 이후 주니퍼 데이터센터 부문 GVP를 역임한 뒤 서터힐 벤처스(Sutter Hill Ventures)의 기업가 레지던트(EIR)로 합류해 다음 창업을 준비했다.

공동창업자 겸 CTO 수바찬드라 찬드라(Subhachandra Chandra)는 미시간 대학교 컴퓨터과학 박사 출신 엔지니어링 리더다. 아리스타 네트웍스에서 소프트웨어 엔지니어링 디렉터로 10년간 스위치 소프트웨어를 이끌었고, 이후 자율주행 소프트웨어 스타트업 고스트(Ghost Autonomy)에서 수년간 경험을 쌓았다. 두 창업자 모두 서터힐 벤처스에서 EIR 과정을 거쳤고, 이번 투자 구성에도 그 관계가 그대로 반영됐다.

이번 투자는 서터힐 벤처스가 주도했고, 아트레이데스 매니지먼트(Atreides Management), 발러 이퀴티 파트너스(Valor Equity Partners), 이클립스 벤처스(Eclipse Ventures)가 참여했다. 아트레이데스의 매니징 파트너이자 CIO인 개빈 베이커(Gavin Baker)가 이사회에 합류했고, 서터힐의 스테판 다이커호프(Stefan Dyckerhoff)도 창업 초기부터 이사회에 함께하고 있다. 아트레이데스는 테크 중심 롱숏 공개주 펀드다. VC가 아닌 이 펀드가 시리즈 A에 합류했다는 것 자체가 아리아의 인프라 단위 경제학에 대한 강한 신뢰를 보여준다.

플랫폼은 다섯 개 기둥으로 구성된다. 브로드컴 토마호크(Tomahawk) ASIC 기반의 AI 네이티브 SONiC 스위치가 하드웨어 토대를 이루고, 기존 도구 대비 100~1만 배 정밀한 마이크로초 단위 텔레메트리를 스위치·트랜시버·호스트 NIC에서 통합 수집한다. 그 위에 스위칭 ASIC부터 클라우드 오케스트레이션까지 레이어별로 특화된 AI 에이전트가 신호를 분석하고 실시간으로 조치를 취한다. 딥 네트워킹 전문 지식이 모든 에이전트와 의사결정에 내재화돼 있으며, 매주 새 기능이 클라우드를 통해 업데이트된다. 이 다섯 요소가 맞물리면서 워크로드를 처리할수록 네트워크가 더 스마트해지는 플라이휠이 돌아간다는 게 회사 설명이다.

운영 방식도 기존 네트워킹과 다르다. 자연어로 요구사항을 입력하면 플랫폼이 패브릭을 알아서 구성하고, 이슈가 생기면 즉시 알림과 함께 에이전트에게 질문해 원인을 파악하고 해결 전략을 같이 짤 수 있다. 아리아는 MCP(Model Context Protocol) 서버도 제공해 외부 시스템이 네트워크 상태를 직접 조회하고 의사결정에 통합하도록 설계했다. 카람 CEO는 “네트워크에 LLM을 붙인다고 해결되는 게 아니다”라며 “필요한 맥락과 데이터 없이 작동시키면 환각을 일으켜 네트워크를 다운시킬 수 있다”고 말했다.

하드웨어 라인업은 두 가지다. 토마호크5 ASIC 기반의 800G 스위치(64포트)와 토마호크6 기반 1.6T 스위치로 구성되며, 액랭·공랭 모두 지원한다. 올해 AI 서버의 76%가 액랭을 채택할 것으로 예상되는 흐름에 맞춘 선택이다. AMD 펜산도 폴라라(Pensando Pollara) 400 AI NIC 인증을 완료해 엔비디아·AMD·구글 칩과의 호환성도 갖췄다.

스케일아웃 이더넷 스위치 시장의 경쟁은 치열하다. 아리스타 네트웍스, 시스코(Cisco), 주니퍼(현 HPE 산하)가 기존 강자로 자리를 지키고 있고, 스타트업 진영에서는 드라이브넷(DriveNets)이 화이트박스 기반 스케일아웃으로 승부를 건다. 스케일업 쪽에서는 업스케일 AI가 별도의 전선을 형성하고 있다. AI 데이터센터 네트워킹 시장은 2026년 128억 달러 규모로, 2035년까지 연평균 24%씩 성장해 300억 달러를 넘어설 전망이다. 경쟁 구도 전반은 AI 데이터센터 인프라 지형도에서 확인할 수 있다.

파트너십도 눈여겨볼 만하다. 와우테일이 앞서 보도한 추론 전용 칩 스타트업 포지트론 AI는 아리아를 핵심 파트너로 꼽았다. 포지트론의 토마스 솜머스(Thomas Sohmers) CTO는 “클러스터 MFU와 MBU(모델 대역폭 활용률) 최적화에 집중하는 첫 번째 네트워킹 회사”라며 “아리아가 우리 하드웨어를 설계대로 작동하게 해주는 플랫폼”이라고 했다.

2024년 10월 설립된 아리아 네트웍스는 현재 고객 주문을 확보하고 실제 배포에 들어간 상태다. 카람 CEO는 “토큰 초당 처리량이 10% 오르면 매출도 10% 오른다”고 말했다. 네트워크를 비용이 아닌 수익 레버로 보는 시각이다.

기사 공유하기

답글 남기기