오픈AI, 8분 만에 AI 에이전트 만드는 ‘에이전트킷’ 공개


오픈AI(OpenAI)가 자사 연례 개발자 컨퍼런스 DevDay 2025에서 AI 에이전트의 구축부터 배포, 최적화까지 전 과정을 통합한 개발 플랫폼 ‘에이전트킷(AgentKit)’을 공개했다. 10월 6일 샌프란시스코 포트 메이슨에서 선보인 이 도구는 개발자가 복잡한 코딩 없이도 시각적 인터페이스로 AI 에이전트를 신속하게 만들 수 있도록 지원한다.

Visual Agent Builder Template Assets - 와우테일

“수개월 걸리던 작업을 몇 시간에”

샘 올트먼 최고경영자는 키노트에서 “오늘 에이전트킷을 출시한다. 이는 개발자와 기업이 에이전트를 구축, 배포, 최적화할 수 있는 완전한 도구 세트”라며 “지금까지 에이전트를 구축한다는 것은 복잡한 오케스트레이션, 버저닝 없는 커스텀 커넥터, 수동 평가 파이프라인, 프롬프트 튜닝, 그리고 출시 전 수주간의 프론트엔드 작업을 저글링하는 것을 의미했다”고 설명했다.

오픈AI 공식 발표에 따르면 에이전트킷을 사용하면 개발자는 이제 새로운 구성 요소를 사용해 워크플로우를 시각적으로 설계하고 에이전트 UI를 더 빠르게 임베드할 수 있다. 핀테크 기업 램프(Ramp)의 사례가 이를 입증한다. 램프 팀은 빈 캔버스에서 시작해 불과 몇 시간 만에 구매자 에이전트를 완성했다.

램프의 제품 담당자는 “에이전트 빌더가 수개월의 복잡한 오케스트레이션, 커스텀 코드, 수동 최적화가 필요했던 작업을 단 몇 시간으로 바꿨다”며 “시각적 캔버스가 제품, 법무, 엔지니어링 팀을 같은 페이지에 놓게 해, 반복 사이클을 70% 단축하고 에이전트를 2분기가 아닌 2스프린트 만에 라이브로 만들었다”고 밝혔다.

4대 핵심 구성 요소

에이전트킷은 네 가지 핵심 구성 요소로 이뤄진다.

에이전트 빌더(Agent Builder)는 드래그 앤 드롭 방식의 시각적 캔버스다. 개발자는 노드를 연결하는 방식으로 멀티 에이전트 워크플로우를 생성하고 버저닝할 수 있다. 도구를 연결하고, 커스텀 가드레일을 구성하며, 프리뷰 실행과 인라인 평가 설정, 전체 버저닝을 지원한다. 빈 캔버스에서 시작하거나 사전 구축된 템플릿을 사용할 수 있다. 현재 베타로 제공된다.

챗킷(ChatKit)은 개발자가 자신의 제품에 커스터마이징 가능한 챗 기반 에이전트 경험을 임베드하기 위한 툴킷이다. 개발자는 자체 브랜드, 워크플로우 등 제품을 독특하게 만드는 요소를 적용할 수 있다. 스트리밍, 스레드, “사고 중(thinking)” UI를 처리한다. 챗킷은 10월 6일부터 모든 개발자에게 정식 출시(GA)됐다.

캔바(Canva)는 챗킷을 활용해 개발자 커뮤니티를 위한 지원 에이전트를 구축했다. 캔바 담당자는 “챗킷으로 지원 에이전트를 구축하는 데 2주 이상을 절약했고, 1시간 이내에 통합했다. 이 지원 에이전트는 개발자가 문서와 상호작용하는 방식을 대화형 경험으로 전환해, 캔바에서 앱과 통합을 쉽게 구축하도록 만들 것”이라고 밝혔다.

커넥터 레지스트리(Connector Registry)는 관리자가 오픈AI 제품 전반에서 데이터와 도구가 어떻게 연결되는지 관리하는 중앙 집중식 장소다. 드롭박스(Dropbox), 구글 드라이브(Google Drive), 셰어포인트(SharePoint), 마이크로소프트 팀즈(Microsoft Teams) 같은 데이터 소스를 단일 관리 패널에 통합한다. 글로벌 관리 콘솔이 있는 API, 챗GPT 엔터프라이즈 및 에듀 고객 일부에게 베타 롤아웃이 시작됐다.

평가(Evals) 기능은 신뢰할 수 있는 프로덕션급 에이전트를 구축하기 위한 엄격한 성능 평가를 제공한다. 오픈AI는 데이터셋, 트레이스 그레이딩, 자동화된 프롬프트 최적화, 타사 모델 지원이라는 네 가지 새로운 기능을 추가했다. 데이터셋을 통해 자동화된 그레이더와 인간 주석으로 에이전트 평가를 빠르게 구축하고 확장할 수 있다. 트레이스 그레이딩은 각 단계에서 무엇이 잘못됐는지 식별해 엔드투엔드 워크플로우 평가를 가능하게 한다.

8분 만에 에이전트 구축 라이브 데모

에이전트킷의 파급력을 입증하기 위해 오픈AI 기술 스태프 크리스티나 황이 무대에 올라 라이브 데모를 진행했다. 황은 DevDay 웹사이트 방문자에게 세션을 추천하고 안내하는 에이전트를 8분도 채 안 돼 완성했다. 49초를 남기고 에이전트를 완료했으며, 즉시 참석자들이 사용할 수 있었다.

황은 “불과 몇 분 만에 에이전트 워크플로우를 시각적으로 설계하고, 도구와 위젯을 추가하며, 미리보기하고, 배포하고, 테스트까지 마쳤다”며 “이제 여러분 모두 사용할 수 있다”고 말했다. 실제로 데모 종료 직후 DevDay 디렉토리 페이지에 ‘Ask Froge’라는 링크가 생성됐고, 참석자들은 즉시 새로 만들어진 에이전트를 활용할 수 있었다.

클라나, 고객 티켓 3분의 2를 AI 에이전트가 처리

에이전트킷의 실제 비즈니스 영향력은 클라나(Klarna)의 사례에서 극명하게 드러난다. 오픈AI는 3월 리스폰스 API와 에이전트SDK를 출시한 이후, 개발자와 기업이 심층 리서치, 고객 지원 등을 위한 엔드투엔드 에이전트 워크플로우를 구축하는 것을 봤다고 밝혔다. 클라나는 지원 에이전트를 구축해 모든 티켓의 3분의 2를 처리한다.

클라나의 AI 어시스턴트는 오픈AI 기술로 구동되며, 출시 첫 달에 230만 건의 대화를 처리했다. 이는 클라나 고객 서비스 챗의 3분의 2에 해당한다. 700명의 풀타임 에이전트에 해당하는 작업을 수행하며, 고객 만족도 점수는 인간 에이전트와 동등하다. 문의 해결의 정확도가 높아져 반복 문의가 25% 감소했다. 고객은 이전 11분 대신 2분 이내에 문의를 해결한다. 23개 시장에서 24시간 이용 가능하며 35개 이상의 언어로 소통한다. 2024년 클라나에 4000만 달러의 수익 개선을 가져올 것으로 추산된다.

클라나 공동 창립자이자 CEO 세바스찬 시에미아트코우스키(Sebastian Siemiatkowski)는 “고객 상호작용에서의 이 AI 돌파구는 고객에게 더 나은 가격에 우수한 경험을, 직원에게 더 흥미로운 도전 과제를, 투자자에게 더 나은 수익을 의미한다”고 밝혔다.

클레이, 영업 에이전트로 10배 성장 달성

세일즈 자동화 플랫폼 클레이(Clay)는 에이전트킷으로 영업 에이전트를 구축해 10배 성장을 달성했다. 클레이는 GTM(Go-To-Market) 팀이 리드 정보를 중앙 집중화하고 개인화된 메시징을 가능하게 해 아웃리치를 확장하도록 돕는다.

클레이는 GPT-4와 통합해 클레이전트(Claygent)라는 AI 에이전트를 만들었다. 클레이전트는 웹사이트를 방문해 관련 정보를 찾고 요약하며, 영업 개발 연구원이 작동하는 방식을 복제하지만 훨씬 빠르고 저렴하다. 클레이전트를 사용하면 한 사람이 전체 팀의 작업을 처리할 수 있다.

클레이는 지난 2년간 매년 10배 성장을 달성했으며, 인터콤(Intercom), 베르카다(Verkada), 노션(Notion) 등 주요 고객을 포함해 10만 명 이상의 사용자를 보유하고 있다. 클레이 고객의 30%가 클레이전트를 매일 사용하며, 하루 50만 건의 리서치 및 아웃리치 작업을 생성한다.

클레이 공동 창립자이자 CEO 카림 아민(Kareem Amin)은 “LLM 이전의 모든 도구는 SDR이나 BDR이 수행하던 리서치를 자동화하려 했지만 막혔다. 데이터 제공업체는 회사당 최대 100개의 데이터 포인트를 제공할 수 있었다. 엔지니어들은 스크레이퍼를 구축했지만 까다롭고 시간이 많이 걸렸다”고 설명했다.

허브스팟, 알버트슨스 등 기업 채택 확산

기업 소프트웨어 업체 허브스팟(HubSpot)은 에이전트킷을 활용해 고객 지원 에이전트를 구축했다. 올트먼은 키노트에서 허브스팟이 에이전트킷 소프트웨어를 사용해 브리즈 AI(Breeze AI) 도구를 개선했다고 언급했다. 브리즈 AI는 고객 문의에 대해 더 매력적인 응답을 생성할 수 있다. DevDay 키노트에서 허브스팟이 언급된 직후 허브스팟 주가는 거의 7% 급등했다.

대형 유통업체 알버트슨스(Albertsons)도 에이전트킷을 활용했다. 직원은 에이전트에게 “아이스크림 매출을 개선할 계획을 세워줘”라고 요청할 수 있다. 에이전트는 계절성, 과거 트렌드, 외부 요인 등 전체 컨텍스트를 살펴보고 추천을 제공한다.

일본 기업 LY 코퍼레이션(LY Corporation)도 에이전트킷을 사용해 개발 사이클을 70% 단축했다. 빈 캔버스에서 몇 시간 만에 라이브 구매자 에이전트를 만들었다. 이는 이전에 수개월이 걸리던 작업이었다.

리스폰스 API 기반, 표준 API 가격에 제공

에이전트킷은 오픈AI의 리스폰스 API(Responses API)를 기반으로 구축됐다. 리스폰스 API는 3월 출시됐으며, 에이전트가 추론하는 실행 코어를 제공한다. 에이전트 빌더의 워크플로우는 리스폰스 API를 위한 구조화된 명령어로 컴파일되며, 이는 모델 호출, 도구 사용, 컨텍스트 전달을 처리한다.

커넥터 레지스트리는 외부 도구에 대한 인증과 라우팅을 처리하고, 평가와 RFT(Reinforcement Fine-Tuning)는 시간이 지남에 따라 에이전트를 개선하는 피드백 루프를 제공한다. 이러한 통합은 개발자가 더 이상 오케스트레이션 로직, 모델 평가 파이프라인, 안전 계층을 별도로 처리할 필요가 없음을 의미한다. 모든 것이 관리되는 보안, 자동 버저닝, 내장 테스트를 갖춘 오픈AI의 제어 평면 내에서 기본적으로 실행된다.

에이전트킷의 모든 도구는 표준 API 모델 가격에 포함된다. 별도의 추가 비용 없이 에이전트 빌더, 챗킷, 커넥터 레지스트리, 평가 도구를 모두 사용할 수 있다. 오픈AI는 곧 독립형 워크플로우 API와 챗GPT를 위한 에이전트 배포 옵션을 추가할 계획이다.

RFT로 에이전트 성능 지속 개선

오픈AI는 에이전트 성능을 더욱 향상시키기 위해 RFT(Reinforcement Fine-Tuning) 베타에 두 가지 새로운 기능을 도입했다. 커스텀 도구 호출은 모델이 더 나은 추론을 위해 적절한 시기에 적절한 도구를 호출하도록 훈련한다. 커스텀 그레이더는 사용 사례에서 가장 중요한 것에 대한 커스텀 평가 기준을 설정한다.

RFT를 통해 모델은 시간이 지남에 따라 에이전트 워크플로우에서 더 나은 결정을 내리는 방법을 학습한다. 평가 데이터를 사용해 모델의 도구 선택, 추론 경로, 출력 품질을 개선한다. 이는 에이전트가 프로덕션 환경에서 지속적으로 개선되도록 보장한다.

가드레일로 안전성 확보

에이전트킷은 오픈 모듈식 안전 계층인 가드레일(Guardrails)을 포함한다. 가드레일은 에이전트가 의도하지 않거나 악의적인 행동으로부터 보호하는 데 도움을 준다. 개인 식별 정보(PII)를 마스킹하거나 플래그하고, 탈옥(jailbreak)을 감지하며, 노드/도구 경계에서 정책을 적용할 수 있다. 커스터마이징 가능한 안전 장치를 지원해 책임감 있는 AI 배포를 돕는다.

올트먼은 “소프트웨어를 구축하는 데 수개월이나 수년이 걸렸지만, 이제는 AI와 함께 몇 분 만에 만들 수 있다는 것을 보셨을 것”이라며 “거대한 팀이 필요하지 않다. 좋은 아이디어만 있으면 그 어느 때보다 빠르게 현실로 만들 수 있다”고 강조했다.

에이전트킷은 10월 6일부터 오픈AI 플랫폼을 통해 개발자에게 제공된다. 챗킷과 새로운 평가 기능은 모든 개발자에게 정식 출시됐으며, 에이전트 빌더는 베타로 제공된다. 커넥터 레지스트리는 글로벌 관리 콘솔이 있는 일부 API, 챗GPT 엔터프라이즈 및 에듀 고객에게 베타 롤아웃이 시작됐다.

YouTube 동영상

DevDay 2025에서 발표한 내용은 아래를 참고하시길.

기사 공유하기

답글 남기기