릴레이스, 2300만 달러 투자 유치.. “AI 코딩 에이전트 인프라 구축”


릴레이스(Relace)가 AI 코딩 에이전트 전용 인프라 구축을 위해 2300만 달러(약 308억원) 규모의 시리즈A 투자를 유치했다고 8일 발표했다. 앤드리슨 호로위츠(Andreessen Horowitz, a16z)가 투자를 주도했으며 매트릭스 파트너스(Matrix Partners)와 와이 콤비네이터(Y Combinator)가 참여했다.

relace series a blog - 와우테일

릴레이스는 AI가 작성한 코드를 실제 서비스 환경에서 바로 사용할 수 있도록 돕는 특화 모델과 인프라를 개발하는 스타트업이다. 수십 년간 사람이 직접 코드를 작성했지만, 이제는 AI 에이전트가 코드를 생성하는 시대로 접어들었다. 문제는 병목 지점이 ‘코드 작성’에서 ‘코드 실행’으로 옮겨갔다는 점이다.

프레스턴 저우(Preston Zhou) 최고경영자와 에이탄 보르니아(Eitan Borgnia) 최고기술책임자가 2022년 공동 창업한 릴레이스는 현재 8명의 팀으로 구성됐다. 저우는 물리학에서 머신러닝으로 전환한 AI 연구 및 엔지니어링 배경을 갖췄고, 보르니아는 시카고대학교에서 머신러닝 박사 과정을 거친 뒤 칼텍(Caltech)에서 수학 학위를 받은 인물로 시스템 프로그래밍과 인프라 분야 전문가다.

현재 수십 개의 AI 스타트업이 최고의 코딩 에이전트를 만들기 위해 경쟁하고 있지만, 대부분 비슷한 툴셋, 샌드박스 실행 환경, 소스 제어 시스템을 독립적으로 재구축하고 있다. 릴레이스는 이런 요소들이 결국 데이터베이스나 인증처럼 외부 서비스로 전환될 것으로 내다봤다. 웹 개발에서 데이터베이스, 배포, 인증을 더 이상 경쟁 우위로 보지 않고 외주를 주듯, 코딩 에이전트 설계에서도 같은 변화가 일어날 것이란 판단이다.

릴레이스의 핵심은 세 가지 전문 모델이다. 첫째, ‘인스턴트 어플라이(Instant Apply)’ 모델은 AI가 생성한 코드를 사람의 손질 없이 실시간 프로젝트에 바로 통합한다. 기존 코드베이스를 편집할 때 대부분의 코드는 그대로 유지된다. 프런티어 모델에 코드 스니펫을 생성하도록 한 뒤 릴레이스로 초당 2500개 이상의 토큰으로 병합하면, 어려운 새 코드 섹션만 프런티어 모델이 생성하고 컨텍스트는 더 빠르고 경제적인 모델이 채워넣는 역할 분리가 가능하다. 이 모델은 초당 1만 개 이상의 토큰을 처리하며 평균 처리 시간은 900밀리초에 불과하다. 클로드(Claude) 3.7 같은 최신 모델은 초당 100~200개 토큰을 생성하고 출력 100만 토큰당 15달러의 비용이 들지만, 릴레이스의 어플라이 모델은 변경되지 않은 코드 부분에 대한 비용을 절감하고 속도를 크게 높인다.

둘째, ‘임베딩(Embedding)’ 모델과 ‘리랭커(Reranker)’ 모델은 코드 검색에 특화됐다. 코드베이스를 변경하는 사용자 요청이 주어지면 해당 요청을 구현하는 데 관련된 파일만 검색해야 한다. 이는 두 가지 이유에서 중요하다. 프런티어 모델 성능은 약 5만 토큰 이후 꾸준히 저하되고, 관련 없는 파일로 컨텍스트 윈도우를 오염시키면 생성된 코드의 품질이 떨어진다. 입력 토큰은 비용이 비싸서 전달하는 파일이 적을수록 비용이 절감된다. 시중의 많은 검색 모델은 일반 RAG 시스템에 최적화돼 있어 코드에서는 성능이 떨어진다.

임베딩 모델과 리랭커는 모두 트랜스포머 기반 대형 언어 모델로 두 입력(이 경우 쿼리와 후보 코드 스니펫)을 비교하는 데 사용된다. 차이점은 비교가 일어나는 시점이다. 리랭커는 두 입력을 컨텍스트 윈도우에 넣고 0과 1 사이의 유사도 점수를 직접 출력한다. 임베딩 모델은 두 입력 각각에 대해 k차원 벡터를 별도로 출력하고, 벡터 간 코사인 유사도를 계산해 점수를 얻는다. 임베딩의 장점은 코드베이스에 대해 미리 계산할 수 있다는 점이다. 사용자가 요청하면 쿼리에 대해서만 새 임베딩을 계산하고 효율적인 벡터 유사도 알고리즘으로 모든 코드 임베딩과 비교할 수 있다. 리랭커는 사용자 요청마다 전체 코드베이스를 병렬로 모델에 통과시켜야 하지만 더 정확하다.

릴레이스는 리랭커와 임베딩 모델을 사용자 쿼리와 관련된 코드 파일을 검색하도록 구체적으로 훈련시켰다. 릴레이스 리랭커의 리콜@k는 다양한 벤치마크에서 최고 수준이다. 동적 UI 코드베이스의 경우 릴레이스 리랭커는 모든 것을 컨텍스트에 전달하는 것과 비교해 입력 토큰 비용을 절반으로 줄인다. 배포를 최적화해 모델에서 엄청난 처리량을 달성하고 약 1~2초 만에 전체 코드베이스의 순위를 매긴다. 이는 높은 지연 시간이 사용자 불만으로 이어지는 실시간 AI 코드 생성 애플리케이션에 매우 중요하다. 수십만 개의 쿼리-코드 쌍으로 훈련해 관련 없는 파일을 효과적으로 걸러내고 입력 토큰 사용량을 50% 이상 줄인다. 비용을 절감할 뿐 아니라 컨텍스트 윈도우를 정리해 AI 에이전트의 생성 품질을 크게 개선한다.

셋째, 릴레이스는 코드베이스 버전 관리, 배포, 상태 관리를 포함한 개발 생명주기 전반의 인프라도 구축하고 있다. 전통적인 개발 도구는 사람을 위해 설계됐지만, 코딩 에이전트는 프로덕션 환경에 직접 연결되는 API와 프레임워크가 필요하다.

릴레이스는 이미 러버블(Lovable), 매직 패턴스(Magic Patterns), 오키즈(Orchids), 코드버프(Codebuff), 크리에이트(Create), 템포 랩스(Tempo Labs) 등 40개 이상의 프롬프트 투 앱(prompt-to-app) 기업에서 매주 수천만 회 호출되며 검증받았다. 러버블은 채팅 인터페이스만으로 소프트웨어 제품을 구축할 수 있는 AI 기반 코드 생성 플랫폼이다. 매직 패턴스는 텍스트 프롬프트나 스크린샷을 편집 가능한 컴포넌트와 화면으로 변환하고 프로덕션 준비가 된 깨끗한 코드를 제공하는 AI 플랫폼이다. 오키즈는 텍스트 프롬프트로 아름다운 웹사이트를 구축하는 AI 풀스택 엔지니어 도구로 와이 콤비네이터 2025 동계 배치에 선정됐다.

한 스타트업 창업자는 “릴레이스의 빠른 코드 재작성 덕분에 수정이 훨씬 안정적이고 전체 버그 클래스가 사라졌다”고 평가했다. 피그마(Figma)와 러버블 같은 기업이 릴레이스 모델을 프로덕션 환경에서 운영하고 있다.

시리즈A 투자와 함께 릴레이스는 ‘릴레이스 리포스(Relace Repos)’의 퍼블릭 베타를 출시한다. 이는 모델과 깊이 통합된 첫 인프라 제품으로, AI 에이전트를 위한 깃허브(GitHub)라 할 수 있으며 2단계 검색 기능이 내장돼 있다. 향후 6개월간 검색, 병합 충돌 해결, 코드베이스 리팩터링 같은 핵심 작업을 수행할 수 있는 유틸리티 에이전트를 배포할 예정이다. 에이전트가 고빈도 커밋을 수행하면서도 컨텍스트를 간편하게 검색하고 탐색하고 가져올 수 있게 한다.

앤드리슨 호로위츠의 요코 리(Yoko Li) 파트너는 “거대한 파운데이션 모델이 주목받고 있지만, 코드 생성의 진정한 혁신은 최적화된 배포 인프라와 결합된 작고 특화된 모델에 있다”며 “훈련, 추론, 하드웨어의 발전이 오늘날 이를 가능하게 하지만 조각들을 일관된 플랫폼으로 조립해야 한다. 릴레이스가 바로 그 일을 하고 있다”고 말했다. 같은 회사의 귀도 아펜젤러(Guido Appenzeller)는 “AI 소프트웨어 개발이 AI의 1위 시장”이라며 “AI 코딩 에이전트는 도구가 필요하고 릴레이스가 최고의 도구를 만든다”고 평가했다.

릴레이스는 투자금을 엔지니어링 팀 확대, 모델 제품군 확장, 초기 엔터프라이즈 고객 확보에 사용할 계획이다. 릴레이스는 SOC 2 준수 보안 체계를 갖추고 있으며, 엔터프라이즈 고객을 위해 온프레미스 및 VPC 격리 배포 옵션도 제공한다. 자체 호스팅이나 VPC 배포를 사용할 때 코드는 통제된 환경을 절대 벗어나지 않으며, 호스팅 티어에서도 모든 데이터는 전송 중과 저장 중 암호화된다.

릴레이스는 소프트웨어 온디맨드 시대를 여는 핵심 인프라를 구축하고 있다. 작고 빠른 코딩 에이전트가 보편화되면 디자이너는 코드로 직접 목업을 만들고, 마케터는 코드로 그래픽을 생성하며, 전문직 종사자는 자연어로 대화하며 프레젠테이션을 제작할 수 있다. 카메라폰이 인스타그램의 무대를 마련했듯, 더 빠르고 작은 코딩 에이전트는 근본적으로 새로운 가능성을 열 것이다. 충분히 작아지면 이런 모델은 기기에서 직접 실행되고 추론 비용이 사실상 무료가 될 수 있다. 이미 기즈모(Gizmo) 같은 소셜 플랫폼에서 사용자들이 GPT-5나 제미니 플래시(Gemini Flash)로 생성한 창의적인 웹 앱을 공유하고 있다.

공동 창업자들은 “AI 코드 에이전트가 온디맨드 소프트웨어를 실현하고 있다”며 “이미 기술 전문 지식이 없는 사람들도 코드 에디터를 건드리지 않고 앱 아이디어를 현실로 만들 수 있다”고 말했다. 그들은 “1월 이후 독립형 프롬프트 투 앱 플랫폼이 전례 없는 속도로 성장했고, 이제 SaaS 제공업체들이 코딩 에이전트를 제품에 직접 통합하기 시작했다”며 “대시보드, 데이터 시각화, 워크플로우가 기능 요청이 아니라 온디맨드로 생성되고 있지만 이는 시작에 불과하다”고 설명했다.

그들은 “자율 코드 생성이 확산되면서 전례 없는 양의 코드가 생성되고 저장돼야 한다”며 “인간을 위해 구축된 인프라는 이를 사용하는 모델에 최적화된 시스템으로 바뀌어야 한다. 이 인프라는 독특한 트레이드오프가 필요하고 성능과 속도를 위해 모델과 함께 최적화돼야 한다”고 강조했다. 릴레이스는 물리학, 수학, 컴퓨터 과학, 머신러닝 분야의 연구자와 재능 있는 소프트웨어 엔지니어를 채용하고 있다. 최고의 제품 팀이 의존하는 모델을 제공하는 민첩한 AI 연구팀을 만들겠다는 목표다.

앤드리슨 호로위츠는 올해만 AI 인프라 분야에 200억 달러 규모의 메가펀드를 조성하는 등 수십억 달러를 쏟아부었다. 이번 투자는 투자자들이 모델 자체를 홍보하는 것에서 벗어나 모델을 진정으로 유용하게 만드는 인프라를 지원하는 방향으로 움직이고 있음을 보여준다. 릴레이스 공동 창업자들은 “인프라 없이는 코드 생성이 그저 묘기에 불과하지만, 인프라가 있으면 소프트웨어가 살아 있는 생성 구조가 된다. 릴레이스가 향해 가는 세계가 바로 그런 곳”이라고 말했다.

기사 공유하기

답글 남기기