GPU는 이제 시작일 뿐 — 엔비디아 GTC 2026이 보여준 AI 팩토리의 미래


엔비디아(NVIDIA)의 연례 개발자 컨퍼런스 GTC 2026이 3월 16일(현지시각) 미국 캘리포니아 산호세 SAP 센터에서 막을 올렸다. 190개국에서 모인 3만여 명의 청중이 자리를 채운 가운데, 젠슨 황(Jensen Huang) CEO가 약 2시간에 걸쳐 키노트를 진행하며 하드웨어, 소프트웨어, 물리적 AI에 걸친 폭넓은 발표를 쏟아냈다. CUDA 탄생 20주년을 기념하는 자리이기도 했다.

NVIDIA GTC Keynote 2026 - 와우테일
GTC 2026에서 키노트를 하고 있는 젠슨 황 대표. <이미지 출처 : GTC 2026 키노트 화면캡처>

시장의 관심은 이미 상당했다. 키노트 당일 엔비디아 주가는 2%가량 상승했고, 황 CEO는 블랙웰과 베라 루빈 플랫폼을 합산한 구매 수주가 2027년까지 1조 달러에 달할 것이라고 밝혔다. 지난해 전망치 5,000억 달러에서 두 배로 뛴 수치다.

베라 루빈(Vera Rubin): AI 에이전트 시대를 위한 차세대 플랫폼

이번 키노트의 핵심은 단연 차세대 AI 가속 플랫폼 베라 루빈이었다. 엔비디아는 베라 루빈이 블랙웰 울트라 대비 최대 추론 성능 5배(워크로드에 따라 3.3~5배), 추론 토큰 비용 10배 절감을 달성한다고 발표했다. 그록 3 LPU를 포함해 총 7개 칩으로 구성된 이 플랫폼은 소프트웨어까지 수직 통합한 시스템으로 설계됐다. 기본 플래그십인 VR200 NVL72는 베라 루빈 GPU 72개와 베라 CPU 36개를 하나의 랙에 결합하며, 대형 컨텍스트 추론에 특화된 NVL144 구성도 별도로 제공된다. 황 CEO는 이 시스템이 냉각수 온도 45도에서도 안정적으로 운영된다는 점도 강조했다.

여기에 엔비디아가 지난해 말 200억 달러 규모의 IP 라이선스 계약을 체결한 스타트업 그로크(Groq)의 첫 LPU(언어 처리 유닛)인 ‘그로크 3 LPU’도 공개됐다. 완전 인수가 아닌 IP 라이선싱·핵심 인재 영입 방식으로 이뤄진 이 딜은 엔비디아 역대 최대 규모다. 500MB SRAM과 150 TB/s의 대역폭을 자랑하는 그로크 3 LPU는 3분기 출하 예정이며, GPU와 함께 저지연 추론에 특화된 계층형 추론 스택을 구성한다.

나아가 내년 하반기 출시 예정인 베라 루빈 울트라는 GPU 144개를 연결 가능한 더 강력한 랙 시스템으로, 황 CEO는 이를 통해 1,500억 달러의 수익 기회가 열린다고 말했다.

다음 세대 이미 예고 — 파인만(Feynman) 아키텍처

엔비디아는 2028년 출시를 목표로 하는 차차세대 플랫폼 ‘파인만’ 로드맵도 공개했다. 새 GPU, 새 LPU(LP40), 신형 CPU ‘로사(Rosa)’, 블루필드-5, 구리 및 CPO 스케일업을 지원하는 키버(Kyber) 등으로 구성될 예정이다. 여기서 로사는 DNA 구조를 밝힌 과학자 로절린드 프랭클린(Rosalind Franklin)의 이름을 딴 것으로, AI 에이전트 워크로드의 전체 구조를 조율하는 역할을 맡는다. 황 CEO는 2년 안에 토큰 생성 성능을 현재의 200만에서 7억으로 350배 끌어올리겠다는 비전을 제시했다.

NemoClaw: 엔터프라이즈 AI 에이전트 플랫폼

Nvida NemoClaw - 와우테일

소프트웨어 측면에서는 오픈소스 AI 에이전트 플랫폼 오픈클로(OpenClaw)에 대한 엔비디아의 공식 지원이 선언됐다. 황 CEO는 오픈클로를 두고 “인류 역사상 가장 빠르게 성장한 오픈소스 프로젝트”라며, “에이전트 컴퓨터의 운영체제를 오픈소스화했다”고 평했다. “모든 기업이 자신만의 오픈클로 전략을 가져야 한다”는 것이 그의 메시지였다.

이를 기반으로 엔비디아는 기업 환경에 특화된 레퍼런스 스택 NemoClaw를 공개했다. 오픈클로 에이전트를 보안·안정적으로 배포할 수 있도록 돕는 오픈소스 플랫폼으로, 마이크로소프트 시큐리티와도 협력해 에이전트 안전성을 강화하고 있다. 아울러 엔비디아는 퍼플렉시티(Perplexity), 리플렉션(Reflection), 블랙 포레스트 랩스(Black Forest Labs) 등이 참여하는 ‘네모트론 연합(Nemotron Coalition)’도 결성해 오픈 프론티어 모델 개발을 공동 추진한다.

씽킹 머신스 랩과 기가와트급 파트너십

이번 GTC에서 가장 주목받은 파트너십은 미라 무라티(Mira Murati) 전 오픈AI CTO가 이끄는 씽킹 머신스 랩(Thinking Machines Lab)과의 협약이다. 엔비디아는 차세대 베라 루빈 시스템 최소 1기가와트 규모의 다년간 전략적 파트너십을 체결했다. 이는 현재까지 공개된 베라 루빈 확정 대규모 도입 계약 중 첫 사례다.

물리적 AI·자율주행·우주 데이터센터

로보틱스 분야에서도 굵직한 메시지가 나왔다. 황 CEO는 “로봇을 개발하는 모든 주요 기업이 엔비디아와 협력하고 있다”고 밝혔으며, 디즈니와 공동 개발한 〈겨울왕국〉의 ‘올라프’ 로봇이 직접 무대에 등장해 화제를 모았다. 올라프는 엔비디아 옴니버스(Omniverse) 시뮬레이션과 딥마인드(DeepMind) 협업을 통해 훈련된 로봇이다.

자율주행 분야에서는 새로운 파트너 4곳을 발표하고 우버(Uber)와의 협력도 공개하며, “자율주행의 ChatGPT 모먼트가 도래했다”고 선언했다.

더 파격적인 발표도 있었다. 엔비디아는 우주 AI 데이터센터 프로젝트 ‘베라 루빈 스페이스-1(Vera Rubin Space-1)’을 공개했다. 방사선 대응 방안을 개발 중인 이 시스템은 지구 밖 궤도에서도 엔비디아의 가속 컴퓨팅을 제공하는 것을 목표로 한다.

DLSS 5와 게이밍의 미래

AI 데이터센터가 키노트의 중심이었지만, 게이밍 팬들을 위한 발표도 빠지지 않았다. 엔비디아는 3D 가이드 신경 렌더링 기술을 적용한 DLSS 5를 발표했다. 구조적 데이터와 생성형 AI를 결합해 실시간 포토리얼 4K 성능을 로컬 하드웨어에서 구현한다는 게 핵심이다. 황 CEO는 “컴퓨터 그래픽이 살아 숨 쉬게 된다”고 표현했다. 아울러 ARM 기반의 AI PC용 칩셋 N1X도 소개됐다. 미디어텍(MediaTek)과 공동 개발한 이 SoC는 단독 RTX 5070급 GPU 성능을 노트북에 통합하는 것이 목표다.

YouTube 동영상

기사 공유하기

답글 남기기