딥시크, 야누스 프로(Janus-Pro) 공개…DALL-E 3 능가하는 멀티모달 AI 등장


전 세계적으로 주목받고 있는 중국의 AI 연구소 딥시크(DeepSeek)가 최근 새로운 멀티모달(multimodal) AI 모델군 야누스 프로(Janus-Pro)를 공개했다. 이 모델은 이미지 생성과 분석 기능을 동시에 제공하며, AI 개발 플랫폼인 허깅 페이스(Hugging Face)를 통해 다운로드할 수 있다. 특히, 상업적 사용에 제한이 없는 MIT 라이선스로 제공되어 개발자와 기업들 사이에서 큰 관심을 끌고 있다.

deepseek janus pro teaser1 - 와우테일

야누스 프로(Janus-Pro) 모델군은 10억 개에서 70억 개의 파라미터로 구성되어 있으며, 파라미터 수는 모델의 문제 해결 능력과 직접적으로 연결된다. 딥시크는 이 모델을 새로운 자기회귀 프레임워크로 설명하며, 이미지를 분석하고 생성하는 기능을 모두 갖추고 있다고 밝혔다. 특히, 가장 큰 규모의 야누스 프로-7B(Janus-Pro-7B)는 AI 평가 벤치마크인 GenEval과 DPG-Bench에서 OpenAI의 DALL-E 3를 비롯해 PixArt-alpha, Emu3-Gen, 스태빌리티 AI의 스테이블 디퓨전 XL(Stable Diffusion XL)과 같은 경쟁 모델들을 능가하는 성능을 보였다.

딥시크는 야누스 프로(Janus-Pro)가 기존 통합 모델을 뛰어넘으며, 특정 작업에 특화된 모델들의 성능과도 견줄 만하거나 이를 초과한다고 강조했다. 또한, 이 모델이 차세대 통합 다중모달 모델로서의 강력한 후보가 될 것이라고 설명했다.

deepseek janus pro teaser2 - 와우테일

딥시크는 하이플라이어 캐피털 매니지먼트(High-Flyer Capital Management)의 투자를 받은 AI 연구소로, 최근 챗봇 앱이 애플 앱스토어d와 구글 스토어 차트 정상에 오르며 주목받고 있다. 딥시크의 언어 모델은 컴퓨팅 효율적인 기술로 훈련되었으며, 이는 월스트리트 분석가들과 기술 전문가들로 하여금 미국의 AI 경쟁력 우위 유지 가능성과 AI 칩 수요 지속 여부에 대한 의문을 제기하게 만들고 있다.

특히, 딥시크의 성공은 중국의 AI 기술력이 급속도로 성장하고 있음을 보여주는 사례로 평가받고 있다. 미국이 AI 분야에서 선두를 달리고 있지만, 딥시크와 같은 중국 기업들의 기술 혁신은 글로벌 AI 시장의 판도를 바꿀 수 있는 잠재력을 가지고 있다.

야누스 프로(Janus-Pro) 모델의 출시는 멀티모달 AI의 중요성을 다시 한번 부각시켰다. 멀티모달 AI는 텍스트, 이미지, 음성 등 다양한 데이터를 통합해 처리할 수 있어, AI의 활용 범위를 크게 확장할 수 있는 기술로 평가받고 있다. 딥시크는 야누스 프로(Janus-Pro)를 통해 이미지 생성 및 분석 분야에서의 경쟁력을 강화했으며, 이는 향후 AI 시장에서의 입지를 더욱 공고히 할 것으로 기대된다.

기사 공유하기

답글 남기기