네이버클라우드, AI 경량화 추론모델 오픈소스 공개


네이버클라우드가 독자 기술을 활용해 ‘프롬 스크래치(from scratch, 토대부터)’로 개발한 경량화 추론(reasoning)모델 ‘HyperCLOVA X SEED 14B Think’를 상업용으로 이용할 수 있는 무료 오픈소스로 공개했다고 22일 밝혔다. 이번에 공개한 모델은 상용화된 해외 오픈소스 모델을 개조한 것이 아닌 원천기술로 추론 능력과 경량화 기술을 결합해 개발했다. 

NAVERCLOUD - 와우테일

또한 AI 에이전트 서비스의 핵심 기술로 주목받는 추론모델을 연구용으로만 제한하지 않고 비즈니스에도 적용할 수 있게 공개하여, 다양한 산업 영역에서 만들어질 AI 에이전트의 기반 기술로 활용되며 국내 AI 생태계를 한층 활성화시킬 것으로도 전망된다.

HyperCLOVA X SEED 14B Think는 지난달 30일 발표된 추론모델 HyperCLOVA X THINK를 안정적, 비용 효율적으로 서비스에 접목할 수 있게 경량화한 모델이다. 중요도가 낮은 파라미터를 가지치기(pruning)하되 원본 모델이 가진 지식을 최대한 보존시키고, 가지치기 과정에서 손실이 생긴 큰 모델의 지식을 작은 모델에 전이(distillation)하는 방식으로 학습 비용을 크게 낮춘 것이 특징이다.

네이버클라우드 측은 “해당 모델은 140억 개 파라미터 규모의 모델임에도 불구하고, 5억 개 파라미터로 구성된 글로벌 오픈소스 모델보다 더 적은 비용(GPU Hours)으로 학습됐다”며 “동일 크기 글로벌 오픈소스 모델과 비교하면 1회 학습 비용은 약 100분의 1 수준”이라고 밝혔다. 

기사 공유하기

답글 남기기