[YC/시드] AI 모델 내부를 직접 제어한다— 엔배리언트의 해석 가능성 SDK


파운데이션 모델은 강력하지만 다루기 까다롭다. 할루시네이션(hallucination·환각 현상)을 일으키고, 출력 결과가 흔들리며, 과학·공학 워크플로에서 믿기 어려운 결과물을 내놓는 일이 다반사다. 재학습이나 프롬프트 엔지니어링으로 이를 잡으려 해도 비용이 만만치 않고 자칫 모델 전체를 불안정하게 만들 수 있다. 결국 개발팀은 “추측하고 확인하는” 반복의 늪에 빠지고, 모델 행동의 근본 원인은 끝내 짚지 못한 채 데이터만 손보다 지친다.

envariant logo - 와우테일

샌프란시스코에 본사를 둔 엔배리언트(Envariant)는 바로 이 지점을 파고든다. 2025년 창업한 이 스타트업은 모델 빌더들이 파운데이션 모델의 내부 동작을 분석하고 조종하며 제어할 수 있도록 해주는 AI 해석가능성(interpretability) SDK를 만들고 있다. 와이컴비네이터(Y Combinator) 2026년 겨울 배치(W26)에 선발된 엔배리언트는 최근 YC 런치 페이지를 통해 처음으로 제품을 공개했다.

접근 방식이 독특하다. 기존 방식이 출력 결과를 사후에 평가하는 형태라면, 엔배리언트는 검증 자체를 모델의 잠재 공간(latent space) 안으로 끌어들인다. 속성을 직접 지정하고, 안에서 관측하고, 제어하는 구조다. SDK는 네 가지 핵심 기능을 갖춘다. 할루시네이션·안전성·스타일·불변 조건 등 모델 행동을 감지하고 인과적으로 추적하는 ‘탐지’, 귀납적 추론과 프로그래밍 방식의 행동 조종을 담당하는 ‘스티어링’, 모델이 학습한 도메인 원칙을 사람이 읽을 수 있는 형태로 꺼내는 ‘추출’, 능력 개선에 필요한 엣지 케이스를 자동으로 만들어내는 ‘합성’이다. 이 모든 기능이 단일 핵심 프리미티브(primitive) 위에서 작동하며, 별도의 엔지니어링 구현이나 대규모 데이터셋이 필요 없다는 점이 차별점이다.

초기 성과도 인상적이다. 엔배리언트는 이 하나의 프리미티브만으로 텍스트 LLM 할루시네이션 탐지, 로봇 비전-언어 모델(VLA)의 실시간 성능 저하 감지, 항체 결합 예측 세 영역에서 최첨단(SOTA) 수준의 성능을 달성했다고 밝혔다. 항체 결합 예측은 신약 개발처럼 검증 비용이 특히 큰 생명과학 영역이라 의미가 남다르다.

창업자 바룬 아가왈(Varun Agarwal)은 스탠퍼드와 MIT에서 연구를 진행했고, RNA 치료제 스타트업 인셉티브(Inceptive)와 NASA에서도 AI·바이오엔지니어링 경험을 쌓았다. 이론과 응용을 오간 배경이 모델 내부를 해석하는 인프라 구축에 제격이라는 평이다.

엔배리언트가 주목하는 시장은 광범위하다. 바이오·소재과학·물리 시뮬레이션·로보틱스·자율 시스템처럼 안전이 핵심인 딥테크 분야와, 독자 모델이나 소버린(sovereign) 모델을 직접 운용하는 조직이 주요 타깃이다. 이런 영역들은 “검증 자체가 어렵고 비용이 큰” 다속성·다중 스케일 문제를 공통으로 안고 있어, 잠재 공간 기반 제어가 가장 효과적인 해법이 될 수 있다.

AI 해석가능성 시장은 빠르게 달아오르고 있다. 대표적인 선발 주자는 굿파이어(Goodfire)다. 오픈AI(OpenAI)와 구글 딥마인드(Google DeepMind) 해석가능성 연구팀 출신들이 세운 굿파이어는 올해 2월 B캐피탈(B Capital) 주도로 1억 5,000만 달러 시리즈B를 유치해 기업가치 12억 5,000만 달러의 유니콘이 됐다. 모델 내부 뉴런을 해독하는 ‘엠버(Ember)’ 플랫폼으로 이미 시장을 선점한 상태다. 가이드 랩스(Guide Labs)는 사후 분석이 아닌, 처음부터 해석 가능한 아키텍처로 LLM을 훈련하는 차별화된 경로를 걷고 있다.

MIT 테크놀로지 리뷰가 메카니스틱 해석가능성(mechanistic interpretability)을 2026년 10대 혁신 기술로 꼽을 만큼, 이 분야에 대한 산업계의 관심은 뚜렷하다. 앤트로픽(Anthropic)·구글 딥마인드·오픈AI 등 주요 연구소들도 막대한 자원을 투입하고 있다.

엔배리언트는 장애 모드 탐지 기능 확장, 일반 속성 탐지·측정으로의 범위 확대, 귀납적 추론·스티어링·원칙 추출 영역의 SOTA 결과 공개를 차례로 예고했다. 장기 목표는 메카니스틱 이해를 실제 실행 가능한 역량으로 전환해, 모델 행동 제어에 걸리는 병목을 걷어내는 것이다.

기사 공유하기

답글 남기기