머스크도 관심 집중…업스테이지 ‘솔라 프로 2’, 글로벌 AI 평가서 10대 프런티어 모델 선정


업스테이지는 자사가 개발한 차세대 거대언어모델(LLM) ‘솔라 프로 2’가 글로벌 AI 모델 성능 평가에서 국내 유일의 프런티어 모델로 선정됐다고 21일 밝혔다.

%EC%9D%B4%EB%AF%B8%EC%A7%802 Artificial Intelligence Index - 와우테일
UPSTAGE - 와우테일
사진=일론 머스크 X

이번 평가는 독립 LLM 성능 분석기관 ‘아티피셜 애널리시스(Artificial Analysis)’가 최근 발표한 ‘지능 지표(Intelligence Index)’ 기반이다. 이 지표는 추론, 종합지식, 수학, 코딩 등 7개 대표 벤치마크를 바탕으로 글로벌 상위권 모델을 평가하고 있다.

이번에 업스테이지는 오픈AI, 구글, 메타 등 글로벌 빅테크 기업과 함께 10대 프런티어 모델 개발사로 이름을 올렸다. 솔라 프로 2는 최상위 모델만 선별하는 아티피셜 애널리시스 플랫폼에 유일한 한국 모델로 등록됐다.

일론 머스크 테슬라 최고경영자(CEO)도 이번 결과에 주목했다. AI 스타트업 xAI를 설립하고 AI 서비스 ‘그록(Grok)‘을 출시한 일론 머스크는 자신의 SNS에 이번 결과를 인용해 “그러나 xAI의 그록이 여전히 1위다. 그리고 그록은 빠르게 개선되고 있다”고 게시했다. xAI의 ‘그록 4’는 이번 평가에서 성능은 가장 뛰어나지만, 모델 운영을 위한 비용과 가성비 지표 평가에서 중하위권으로 평가받았다. 

솔라 프로 2는 58점을 기록하며 ‘미스트랄 스몰(55)’, ‘GPT-4.1(53)’, ‘라마 4 매버릭(51)’, ‘GPT-4o(41)’ 등 빅테크 LLM을 제치고 더 높은 성능을 기록했다. 또한, ‘딥시크 V3(53)’와 문샷 AI의 ‘키미 K2(57.59)’ 등 중국 모델도 모두 추월하며 상위권에 안착했다.

주요 프런티어 모델 대부분은 1천억~2천억 매개변수(파라미터)를 탑재한 대형 모델이며, 가장 높은 성능을 기록한 xAI의 ‘그록-4’는 1조 7천억(1.7T)에 달한다. 반면 솔라 프로 2는 단 310억 매개변수로 이들과 어깨를 나란히 하며, 업스테이지 소형 언어모델의 압도적인 기술 경쟁력과 효율성을 입증했다.

특히, GPT-4.1은 현재 기업 환경에서 가장 널리 쓰이는 범용 모델로, 대부분의 업무에서 충분한 성능을 제공하는 것으로 평가받지만, 솔라 프로 2는 이를 넘어서면서 고난도 추론 능력에서 확실한 우위를 차지했다. 비용 대비 성능 평가에서도 ‘클로드 4 소넷’, ‘마지스트랄 스몰’ 등 주요 모델보다 효율적인 것으로 평가돼, 기업 입장에서 최소 도입 비용으로  최고의 성능을 구현할 수 있는 모델로 주목받고 있다.

추후 업스테이지는 후속 모델로 1000억 파라미터 규모의 차세대 LLM을 개발할 계획으로, 향후 프런티어 인덱스 최상위권 진입도 기대하고 있다.

김성훈 업스테이지 대표는 “국내 기술로 개발한 파운데이션 모델 솔라 프로 2가 글로벌 최상위 모델들과 어깨를 나란히 할 수 있음을 입증해 기쁘다”며 “앞으로도 독자적인 기술력으로 자체 모델을 더욱 고도화하여 대한민국이 AI 3강을 넘어 글로벌 시장에서 기술 주도권을 차지할 수 있도록 기여하겠다”고 밝혔다.

UPSTAGE 1 - 와우테일

기사 공유하기

답글 남기기