[트렌드] AI 쓴 만큼 연봉 올라간다?…실리콘밸리 ‘토큰맥싱’ 논란


AI 시대, 직장인의 경쟁 방식이 달라지고 있다. 누가 더 많은 코드를 짰는지, 누가 더 많은 보고서를 냈는지가 아니다. 지금 실리콘밸리에서는 AI에 얼마나 많은 ‘토큰’을 쏟아붓느냐가 새로운 경쟁의 척도로 부상했다.

tokenmaxxing banner - 와우테일

이른바 ‘토큰맥싱(tokenmaxxing)’이다. AI 모델이 텍스트를 처리하는 기본 단위인 토큰을 최대한 많이 소비하는 것을 목표로 삼는 트렌드다. 용어는 외모를 최적화하는 ‘룩스맥싱(looksmaxxing)’, 수면의 질을 끌어올리는 ‘슬립맥싱(sleepmaxxing)’ 같은 MZ세대 표현에서 왔다. ‘무언가를 끝까지 최적화한다’는 의미다.

뉴욕타임스는 지난 3월 메타(Meta)와 오픈AI(OpenAI) 등 빅테크 엔지니어들이 내부 리더보드에서 AI 토큰 소비량을 두고 경쟁한다고 보도했다. 영업팀이 매출 목표를 관리하듯, 엔지니어들이 토큰 소모량 순위를 놓고 겨루는 문화가 형성됐다는 것이다.

숫자는 어지럽다. 오픈AI 엔지니어 한 명이 단 일주일 만에 2,100억 개의 토큰을 소진했다. 위키피디아 전체 텍스트의 33배에 달하는 분량이다. 앤트로픽(Anthropic)의 AI 코딩 도구 클로드 코드(Claude Code)를 사용하는 개발자 한 명은 한 달 컴퓨팅 비용으로 15만 달러 이상을 썼다. 스웨덴 에릭슨(Ericsson) 소속 엔지니어는 자신의 클로드 코드 사용료가 본인 연봉을 넘어섰다고 밝혔다. 회사가 비용을 대지만, 개인이 일으킨 AI 청구서가 그 사람의 연봉을 추월했다는 사실 자체가 이전엔 상상하기 어려운 일이었다. AI 에이전트 군집을 가동하는 기업에서는 주당 100억 토큰이 소비되기도 한다.

토큰, 보상의 새 항목으로 부상

이 흐름이 보상 구조에도 스며들기 시작했다.

GTC 2026에서 엔비디아(NVIDIA) CEO 젠슨 황(Jensen Huang)은 엔지니어에게 기본급의 절반에 해당하는 AI 토큰 예산을 별도로 지급해야 한다고 제안했다. 핵심 인재의 경우 연간 25만 달러 상당이다. 그는 토큰 예산이 실리콘밸리의 새로운 채용 도구가 될 것이라 예측했다. 벤처캐피털리스트 토마스 퉁구즈(Tomasz Tunguz)는 이미 기술 기업들이 추론 비용을 급여·보너스·주식에 이어 네 번째 보상 항목으로 다루기 시작했다고 짚었다. 현재 그의 추론 지출은 총 보상의 약 5분의 1에 달한다. 샘 올트먼(Sam Altman) 오픈AI 최고경영자는 한발 더 나아가 ‘보편적 기본 컴퓨팅 파워’가 언젠가 ‘보편적 기본소득’을 대체할 수 있다는 구상을 내놓기도 했다.

인사 평가에도 변화가 나타났다. 메타는 올해 직원 성과 리뷰에 AI 활용도를 공식 반영한 첫 번째 빅테크 기업이 됐다. 구직 시장도 달라졌다. 오픈AI의 코딩 에이전트 서비스 코덱스(Codex) 엔지니어링 리드는 지원자들이 연봉보다 “추론 컴퓨팅 자원을 얼마나 받을 수 있는지”를 먼저 묻는다고 전했다.

앤트로픽은 이 흐름의 직접적인 수혜자다. 2026년 초 단 두 달 만에 매출 목표를 두 배로 상향했는데, 클로드 코드 같은 에이전틱 코딩 도구의 수요 폭발이 배경이다. 오픈AI 코덱스 에이전트의 주간 활성 사용자는 1월 대비 세 배 늘었고, 플랫폼 전체 토큰 사용량은 다섯 배 증가했다.

“이건 코드 줄 수 세기의 재탕이다”

그러나 토큰맥싱을 바라보는 시선이 마냥 긍정적인 것은 아니다. 오히려 비판이 더 날카롭다.

가장 직접적인 문제 제기를 한 건 15년 경력의 엔지니어링 리더 던컨 그레이지어(Duncan Grazier)다. 그는 토큰맥싱이 “에이전틱 시대의 코드 줄 수 세기”라고 잘라 말했다. 2000년대 초반, 일부 기업들이 개발자 생산성을 작성한 코드 줄 수로 측정한 적이 있다. 결과는 실패였다. 가장 많은 코드를 생성한 엔지니어가 최고의 기능을 만들지 않았다. 가장 유지보수하기 힘든 코드를 양산했다. 이후 ‘속도 포인트’를 도입했더니 사람들이 추정치를 부풀렸고, ‘배포 빈도’로 바꿨더니 위험 부담 없는 소소한 변경만 늘었다. 지표를 바꿔도 같은 함정에 빠졌다.

그레이지어의 핵심 지적은 투입과 산출의 혼동이다. 토큰 리더보드는 얼마나 많은 컴퓨팅을 소비했는지를 측정하면서 그것을 성과라 부른다. 하지만 의도적인 프롬프팅으로 1억 토큰을 쓰고 실제로 제품을 출시한 엔지니어와, 아무도 검토하지 않는 코드를 뱉어내는 에이전트 군집을 돌리며 100억 토큰을 소진한 엔지니어 중 누가 더 생산적인가. 리더보드는 후자의 손을 들어준다.

더 불편한 지점도 있다. 엔지니어 한 명의 토큰 비용이 연봉에 근접하면 CFO 입장에서는 불가피한 질문이 생긴다. ‘인력을 줄이고 컴퓨팅을 늘리면 어떻게 되는가.’ 토큰맥싱 문화는 잘못된 지표를 만드는 데서 한발 더 나아가, 인력 감축의 논리적 근거를 스스로 드러내 준다. 젠슨 황의 제안이 직원에게 후한 복지처럼 들리지만, 토큰 예산은 주식처럼 불어나거나 퇴직금에 반영되지 않는다. 200만 달러짜리 연봉 패키지에 토큰 예산이 추가됐을 때, 그 계산을 한 번 더 들여다볼 사람은 결국 CFO다.

경험이 부족한 주니어 엔지니어에게도 독이 된다. AI 시대에 자신의 가치를 증명해야 한다는 불안을 안고 있는 이들이 순위에서 뒤처질까봐 의미 없는 에이전트 작업을 돌리기 시작하면, 결과물의 질을 판단하는 능력 자체를 키울 기회를 잃는다. 메트라이프(MetLife)가 미국 직장인 수천 명을 조사한 결과, 59%가 AI가 새로운 일자리를 만드는 속도보다 빠르게 기존 직업을 없앨 것을 우려했고, 24%는 직접 AI와 경쟁해야 한다는 압박을 느낀다고 답했다.

리드 호프만(Reid Hoffman) 링크드인(LinkedIn) 공동창업자는 세마포(Semafor) 세계경제 서밋에서 좀 더 균형 잡힌 입장을 내놨다. 토큰 사용량이 기업의 AI 전환 속도를 파악하는 유용한 지표가 될 수 있다고 봤지만, 맥락 없이 숫자만 쫓아서는 안 된다고 선을 그었다. 높은 토큰 사용량이 생산적인 혁신을 반영할 수도 있고, 방향 없는 실험에 불과할 수도 있다는 것이다. 메타가 내부 토큰 리더보드를 결국 폐쇄한 것도 같은 맥락이다. 일각에서는 역효과를 낳는 인센티브 구조를 바로잡으려는 시도로 읽혔지만, 또 다른 분석가들은 AI 인프라의 수직 통합 전략으로 전환하는 신호라고 해석했다.

결국 토큰맥싱 논쟁은 AI 시대의 오래된 질문을 다시 꺼낸다. 측정하기 쉬운 것을 측정하다 보면, 어느 순간 측정이 목적이 된다. 비용을 생산성으로 부르는 순간, 진짜 생산성은 보이지 않게 된다.

수요는 계속 커진다

논쟁의 이면과는 별개로, 토큰 소비 자체는 가파르게 증가하고 있다.

IDC는 전 세계 활성 AI 에이전트가 2030년까지 22억 개를 넘어서고, 연간 토큰 소비량은 2025년 대비 3억 배 이상 급증할 것으로 전망했다. JP모건 체이스(JPMorgan Chase)는 같은 기간 토큰 소비량의 연평균 성장률을 330%로 예측했다. 이 수요가 1조 달러 이상의 AI 인프라 투자를 떠받치는 실질적인 근거다.

수요 급증은 가격에도 영향을 미치기 시작했다. 아마존(Amazon)과 구글(Google)은 이미 AI 서비스 가격을 올렸고, 알리바바 클라우드, 텐센트 클라우드 등도 배포 물량을 감당하지 못해 잇달아 요금을 조정했다. 월 20달러짜리 ChatGPT Plus나 클로드 프로 같은 일반 구독 상품은 엔터프라이즈 계약 수익으로 유지되는 구조다. 그 격차가 벌어질수록 사용량 제한이 강화되거나 가격이 오를 가능성이 높다.

토큰맥싱이 하나의 문화적 현상으로는 사그라들 수 있다. 하지만 AI 컴퓨팅이 개인 단위로 추적되고 가격이 매겨지는 비용 항목이 됐다는 사실은 변하지 않는다. 실리콘밸리의 다음 논쟁은 이미 시작됐다. ‘얼마나 많이 쓰느냐’가 아니라 ‘쓴 것으로 무엇을 만들어냈느냐’다.

기사 공유하기

답글 남기기