글로벌 AI 시장을 뒤흔든 중국의 신흥강자 딥시크(DeepSeek)


중국 AI 기업 딥시크(DeepSeek)가 글로벌 기술 시장에 지각변동을 일으키고 있다. 최근 자사의 챗봇 앱이 애플 앱스토어 차트 정상에 오르며 세계적 주목을 받은 DeepSeek의 성장 배경과 파급력을 살펴본다.

Deepseek main - 와우테일

헤지펀드에서 AI 기업으로

DeepSeek의 시작은 중국의 양적 헤지펀드 High-Flyer Capital Management으로 거슬러 올라간다. 창업자 량원펑(Liang Wenfeng)은 저장대학교 재학 시절부터 트레이딩에 관심을 보였으며, 2013년 AI 알고리즘을 활용한 주식 거래 회사 Jacobi를 설립했다. 2015년에는 현재 80억 달러 규모로 성장한 High-Flyer를 창업했다.

2023년, High-Flyer는 금융 사업과 별개로 AI 도구 연구에 전념할 연구소를 설립했고, 이는 곧 독립 기업 DeepSeek으로 분사했다. 회사는 설립 초기부터 자체 데이터센터 클러스터를 구축하며 모델 학습에 집중했다. 특히 중국 최고 대학의 AI 연구진을 공격적으로 영입하는 한편, 다양한 주제에 대한 이해도를 높이기 위해 컴퓨터 과학 배경이 없는 인재들도 적극 채용했다.

혁신적인 기술력과 파급효과

DeepSeek은 2023년 11월 첫 모델군인 DeepSeek Coder, LLM, Chat을 공개했다. 하지만 진정한 주목을 받기 시작한 것은 2024년 봄 차세대 DeepSeek-V2 모델군을 발표하면서부터다. 이 모델은 다양한 AI 벤치마크에서 우수한 성능을 보이면서도 운영 비용이 현저히 낮았다. 이는 바이트댄스(ByteDance)와 알리바바(Alibaba) 등 중국 내 경쟁사들이 자사 모델의 사용 가격을 인하하거나 무료화하는 계기가 되었다.

2024년 12월 출시된 DeepSeek-V3와 2025년 1월 공개된 추론 모델 R1은 회사의 명성을 더욱 높였다. 특히 R1은 OpenAI의 모델과 견줄만한 성능을 보여주며, 물리학, 과학, 수학 분야에서 높은 신뢰성을 자랑한다.

딥시크는 엔비디아의 H800 GPU 2,000대를 사용해 약 2개월 만에 550만 달러의 비용으로 모델을 훈련시켰다고 발표한 바 있다. 미국 거래 IT기업들이 수억 달러를 투자하고 있는데, 고작 550만달러를 투자해서 동일 또는 그 이상의 성능을 내는 추론 모델을 개발했으니 미국의 충격이 이만저만이 아니다. 

deepseek R1 benchmark - 와우테일
<이미지 출처 : 허깅페이스>

파격적인 오픈소스 사업 전략

DeepSeek은 오픈소스 전략을 채택하고 있다. 현재로는서 명확한 수익 모델 없이 대부분의 제품과 서비스를 시장가보다 훨씬 저렴하게, 때로는 무료로 제공하고 있다. 회사는 이를 효율성 혁신을 통한 비용 절감으로 설명하지만, 일부 전문가들은 이 수치에 의문을 제기한다.

그럼에도 개발자들 사이에서 DeepSeek의 모델은 큰 인기를 얻고 있다. Hugging Face 플랫폼에서만 R1 기반의 파생 모델이 500개 이상 생성되어 250만 회 이상의 다운로드를 기록했다.

페이스북의 모회사인 메타(Meta)의 라마(LLama)도 오픈소스 전략을 취하고 있는데, 향후 딥시크와의 경쟁에서 어떤 모습을 보일지 궁금하다. 이런 관점도 참고. 

- 와우테일

도전 과제와 전망

DeepSeek의 성공은 “AI의 판도를 뒤흔들었다”는 평가를 받으며, 엔비디아 주가 18% 하락을 촉발하고 OpenAI CEO 샘 알트만의 공개적 반응을 이끌어냈다. 샘 알트만은 R1이 비용 대비 성능에서 우수하다는 점을 인정하고, 새로운 경쟁자의 출현을 환영했다.

테크 산업 전반에서 저비용 고성능 모델인 딥시크에 대한 반응은 폭발적이었다. 예를 들어, 인텔(Intel)의 전 CEO이자 IPO 대기 중인 스타트업 글루(Gloo)의  회장인 팻 겔싱어는 DeepSeek의 오픈소스로서의 개방성에 감사를 표했다. 점점 폐쇄적으로 변해가는 미국 거대 IT기업의 기초 AI 모델 작업의 세계를 재설정하는 데 도움을 줄 것이라고 기대감을 표시했다..

Meta의 최고 AI 과학자인 얀 르쿤은 DeepSeek의 오픈소스 전략이 창조적인 AI 발전을 촉진하고 있다고 언급했다. 르쿤은 DeepSeek의 성공이 ‘오픈 소스 모델이 독점 모델을 능가하고 있다’는 것을 보여준다고 말하면서, 이것이 AI 산업에서 더 많은 협력과 혁신을 가능하게 할 것이라고 강조했다. 

하지만 회사는 여러 도전 과제에 직면해 있다. 미국의 첨단 칩 수출 규제로 인해 H100 대신 성능이 낮은 H800 칩을 사용해야 하며, 중국 정부의 인터넷 규제로 인해 일부 주제에 대한 응답이 제한된다.

향후 DeepSeek은 더 향상된 모델을 선보일 것으로 예상되나, 미국 정부가 외국의 유해한 영향력으로 간주하며 견제할 가능성도 제기되고 있다. 중국 AI 기업의 성공 사례로 주목받는 DeepSeek의 행보가 글로벌 AI 산업에 어떤 변화를 가져올지 관심이 모아진다.

기사 공유하기

답글 남기기